AI OpenManusをローカルLLMで実行する(Ollama, QwQ-32B) OpenManus をローカルLLMで実行してみました。ついでにAlibabaが最近公開した QwQ-32B モデルも使ってみます。前置きManus とはManusは、中国のスタートアップ企業Monicaが開発した完全自律型のAIエージェン... 2025.03.13 AILLMその他
その他 Davinci Resolve向けに無音カットしたタイムラインを作成する(Python, pydub) 私はあまり動画編集はしないのでDavinci Resolveの無料版を使っています。動画編集に必要な機能は十分すぎるほどあるのですが、無音部分をカットする機能が無料版では使えなかったので、Pythonで無音カットしたタイムラインを作成するス... 2025.03.05 その他
AI HunyuanVideo+ComfyUIでIP2V(Image Prompt To Video) kijai氏のComfyUI-HunyuanVideoWrapperでIP2Vを実行し、画像に似た雰囲気の動画を生成します。概要IP2VIP2V(Image Prompt to Video)は、画像をプロンプトとして利用し、そのスタイルやコ... 2025.03.02 AI動画生成
AI Skyreels V1モデルでImage to Video Skyreels V1モデルを使用し、ComfyUIでローカル動画生成を行いました。Image to Video生成を行い、パラメータについても探ってみます。また、本記事ではネイティブ版ではなくkijai氏のComfyUI-HunyuanV... 2025.02.26 AI動画生成
AI ローカルでもサクサク動画生成(ComfyUI-HunyuanVideoWrapper, I2V) kijai氏のComfyUI-HunyuanVideoWrapperでの動画生成で、生成時間に関わる部分を比較しました。最終的には432x768, 97frames を1動画あたり41秒で生成できました。※ロード時間等は含まず前置き使用モデ... 2025.02.25 AI動画生成
AI ComfyUIとHunyuanVideoでローカル動画生成(I2V) いつの間にかローカル動画生成が進化していました。今回はComfyUIのインストールから、HunyuanVideoを使ってImage2Videoを実行するまでを書いていきます。参考記事: (Reddit) How to run Hunyuan... 2025.02.18 AI動画生成
その他 FDK-AAC(HE-AACv2)入りのffmpegをビルド(Windows, WSL2, Docker) WSL2上のDockerとビルドツールを使って、FDK-AAC入りのffmpegをビルドする手順を書きます。FDK-AACとはFDK-AAC(Fraunhofer FDK AAC)は、Fraunhofer IISが開発したオープンソースのA... 2025.02.15 その他
AI Open WebUI+SearXNGでRAGを構築(Ollama, ローカルLLM) Open WebUI にメタ検索エンジンである SearXNG を連携させ、RAG(Retrieval-Augmented Generation) を試してみました。キャラ: Live2D 桃瀬ひよりボイス: VOICEVOX 猫使ビィ(お... 2025.02.14 AILLM
その他 VOICEVOXの音声とVTubeStudioのリップシンク(Python) VOICEVOX Open API の音声合成用クエリから VTubeStudio とのリップシンクを行うサンプルを作ってみました。※リップシンク: 音声に合わせて口パクさせること実行結果だけ先に貼ります(動画)キャラ: Live2D 桃瀬... 2025.02.12 その他
AI OpenWebUI+ローカルLLM+VOICEVOXをDockerで構築(WSL2, Ollama) 本記事ではOpenWebUI+ローカルLLM+VOICEVOXで会話する環境をDockerでまとめて構築していきます。参考記事:はじめにOpen WebUIでは返答を音声で読んでくれる機能あります。発話方法は2種類Web API (Spee... 2025.02.10 AILLM