ふつかブログ

スポンサーリンク
AI

FramePack を試してみた(ローカル動画生成)

Illyasviel氏が FramePack というリポジトリを公開しました。最低6GBのGPUメモリで1分以上の動画が生成できるという、いままでにないローカルAI動画生成ツールです。動画生成の種類としては Image To Video(I...
AI

Gemma3でtoolsを使用する(Ollama, ローカルLLM)

Gemma3は画像入力に対応している上にテキストでの返答もとても優秀なのですが、tools に対応していないところが不便です。今回はモデルファイルを編集することでGemma3にtoolsを呼び出させてみたいと思います。toolsに対応するこ...
その他

Live2Dモデルを動画にレンダーする(WebCodecs API)

Cubism SDK For Web ではCanvas要素上にLive2Dモデルを描画します。また、WebCodecs APIを使うとCanvas要素の内容を動画に保存できます。これらを組み合わせればLive2Dモデルの動画を作成できるので...
AI

Live2Dモデル + AI で感情表現してもらう(Function Calling, ローカルLLM)

前回の記事でVue.js + Cubism SDK for Webを使って、Live2Dモデルをブラウザ上で表示しました。今回はFucntion Callingを用いることでAIにLive2Dモデルの表情を制御してもらいます。Functio...
その他

Vue.js + Cubism SDK For Web でブラウザ上で動くノベルゲーム風のデモ

Vue.js + Cubism SDK For Web を使って、Live2Dモデルを表示・制御するサンプル的なものを作ってみました。前置きそれぞれの単語について簡単に説明します。Cubism SDK For WebCubism SDK f...
AI

OpenManusをローカルLLMで実行する(Ollama, QwQ-32B)

OpenManus をローカルLLMで実行してみました。ついでにAlibabaが最近公開した QwQ-32B モデルも使ってみます。前置きManus とはManusは、中国のスタートアップ企業Monicaが開発した完全自律型のAIエージェン...
その他

Davinci Resolve向けに無音カットしたタイムラインを作成する(Python, pydub)

私はあまり動画編集はしないのでDavinci Resolveの無料版を使っています。動画編集に必要な機能は十分すぎるほどあるのですが、無音部分をカットする機能が無料版では使えなかったので、Pythonで無音カットしたタイムラインを作成するス...
AI

ComfyUIとHunyuanVideoでローカル動画生成(I2V)

いつの間にかローカル動画生成が進化していました。今回はComfyUIのインストールから、HunyuanVideoを使ってImage2Videoを実行するまでを書いていきます。はじめに実行環境Windows 11NVIDIA RTX 4080...
その他

FDK-AAC(HE-AACv2)入りのffmpegをビルド(Windows, WSL2, Docker)

WSL2上のDockerとビルドツールを使って、FDK-AAC入りのffmpegをビルドする手順を書きます。FDK-AACとはFDK-AAC(Fraunhofer FDK AAC)は、Fraunhofer IISが開発したオープンソースのA...
AI

Open WebUI+SearXNGでRAGを構築(Ollama, ローカルLLM)

Open WebUI にメタ検索エンジンである SearXNG を連携させ、RAG(Retrieval-Augmented Generation) を試してみました。キャラ: Live2D 桃瀬ひよりボイス: VOICEVOX 猫使ビィ(お...
スポンサーリンク