スポンサーリンク
AI

OpenManusをローカルLLMで実行する(Ollama, QwQ-32B)

OpenManus をローカルLLMで実行してみました。ついでにAlibabaが最近公開した QwQ-32B モデルも使ってみます。前置きManus とはManusは、中国のスタートアップ企業Monicaが開発した完全自律型のAIエージェン...
その他

Davinci Resolve向けに無音カットしたタイムラインを作成する(Python, pydub)

私はあまり動画編集はしないのでDavinci Resolveの無料版を使っています。動画編集に必要な機能は十分すぎるほどあるのですが、無音部分をカットする機能が無料版では使えなかったので、Pythonで無音カットしたタイムラインを作成するス...
AI

HunyuanVideo+ComfyUIでIP2V(Image Prompt To Video)

kijai氏のComfyUI-HunyuanVideoWrapperでIP2Vを実行し、画像に似た雰囲気の動画を生成します。概要IP2VIP2V(Image Prompt to Video)は、画像をプロンプトとして利用し、そのスタイルやコ...
AI

Skyreels V1モデルでImage to Video

Skyreels V1モデルを使用し、ComfyUIでローカル動画生成を行いました。Image to Video生成を行い、パラメータについても探ってみます。また、本記事ではネイティブ版ではなくkijai氏のComfyUI-HunyuanV...
AI

ローカルでもサクサク動画生成(ComfyUI-HunyuanVideoWrapper, I2V)

kijai氏のComfyUI-HunyuanVideoWrapperでの動画生成で、生成時間に関わる部分を比較しました。最終的には432x768, 97frames を1動画あたり41秒で生成できました。※ロード時間等は含まず前置き使用モデ...
AI

ComfyUIとHunyuanVideoでローカル動画生成(I2V)

いつの間にかローカル動画生成が進化していました。今回はComfyUIのインストールから、HunyuanVideoを使ってImage2Videoを実行するまでを書いていきます。参考記事: (Reddit) How to run Hunyuan...
その他

FDK-AAC(HE-AACv2)入りのffmpegをビルド(Windows, WSL2, Docker)

WSL2上のDockerとビルドツールを使って、FDK-AAC入りのffmpegをビルドする手順を書きます。FDK-AACとはFDK-AAC(Fraunhofer FDK AAC)は、Fraunhofer IISが開発したオープンソースのA...
AI

Open WebUI+SearXNGでRAGを構築(Ollama, ローカルLLM)

Open WebUI にメタ検索エンジンである SearXNG を連携させ、RAG(Retrieval-Augmented Generation) を試してみました。キャラ: Live2D 桃瀬ひよりボイス: VOICEVOX 猫使ビィ(お...
その他

VOICEVOXの音声とVTubeStudioのリップシンク(Python)

VOICEVOX Open API の音声合成用クエリから VTubeStudio とのリップシンクを行うサンプルを作ってみました。※リップシンク: 音声に合わせて口パクさせること実行結果だけ先に貼ります(動画)キャラ: Live2D 桃瀬...
AI

OpenWebUI+ローカルLLM+VOICEVOXをDockerで構築(WSL2, Ollama)

本記事ではOpenWebUI+ローカルLLM+VOICEVOXで会話する環境をDockerでまとめて構築していきます。参考記事:はじめにOpen WebUIでは返答を音声で読んでくれる機能あります。発話方法は2種類Web API (Spee...
スポンサーリンク