LLMを使ってエッセイ漫画の自動生成を行う
LLMを使ってFlickrのアップロード写真を解析して日記の草稿を自動で書くというのは試しにやっていたのだけれどいまだ投稿までしたことはなく、最近はローカルLLM(qwen3.6-35b-a3b)で全部まかなえるようにしてAPI料金節約というところまではもっていっていた。
そして昨今ではNano Banana 2とかChatGPT Images 2.0も登場して漫画の自動生成も十分使えるようになったことだし、あの頃何やってたかなと振り返った際に漫画で読めたら楽しそうなので、ローカルLLMで画像の選定と漫画のプロットまでは作成してそこから漫画自体の生成を優秀な画像生成APIに投げるという仕組みをCodexに書いてもらった。zip ファイルに固めてチャットUIに添付すればAPI料金も節約できてサブスクリプション課金の範囲でというテクも使える。なんかGeminiはzip内のファイル数の制限あるようだけど。
で、これが先日神戸に行った日のエッセイ漫画生成してみたやつ(対応する 普通の日記 https://x.oq.la/20260406-zj4m https://x.oq.la/20260406 )。プロンプト改善の余地はあるのでもうちょっといじっていきたい。
ざっくり10枚の写真をソースにした場合はChatGPT Images 2.0のAPIで作ると50円弱、Nano Banana 2だと20円くらいという概算をChatGPTにしてもらったので、Nano Banana 2なら無料トークンもあるし、クオリティ問題なさそうならば常用しようかなという気持ちだけれどまだビビってChatGPTのWebUIでしか作ってない。
もうちょっとこれを転用すると、Twitter(X)に逐一投稿している人なんかならそれをソースにしつつテキストもソースに使えるし、Instagramなんかもソースにまとめたりできそう?TwitterはAPI従量課金になったけれどエクスポートデータなら使い放題だし過去の漫画生成なんかなら悪くないかもしれない。
ソースはPythonスクリプト1つなので気が向いたタイミングでGitHubに置いておきたい。
