@oquno@x.oq.la

ブログです oq.la/++

LLMを使ってFlickrのアップロード写真を解析して日記の草稿を自動で書くというのは試しにやっていたのだけれどいまだ投稿までしたことはなく、最近はローカルLLM(qwen3.6-35b-a3b)で全部まかなえるようにしてAPI料金節約というところまではもっていっていた。

そして昨今ではNano Banana 2とかChatGPT Images 2.0も登場して漫画の自動生成も十分使えるようになったことだし、あの頃何やってたかなと振り返った際に漫画で読めたら楽しそうなので、ローカルLLMで画像の選定と漫画のプロットまでは作成してそこから漫画自体の生成を優秀な画像生成APIに投げるという仕組みをCodexに書いてもらった。zip ファイルに固めてチャットUIに添付すればAPI料金も節約できてサブスクリプション課金の範囲でというテクも使える。なんかGeminiはzip内のファイル数の制限あるようだけど。

2026-04-04 の自動生成エッセイ漫画

で、これが先日神戸に行った日のエッセイ漫画生成してみたやつ(対応する 普通の日記 https://x.oq.la/20260406-zj4m https://x.oq.la/20260406 )。プロンプト改善の余地はあるのでもうちょっといじっていきたい。

ざっくり10枚の写真をソースにした場合はChatGPT Images 2.0のAPIで作ると50円弱、Nano Banana 2だと20円くらいという概算をChatGPTにしてもらったので、Nano Banana 2なら無料トークンもあるし、クオリティ問題なさそうならば常用しようかなという気持ちだけれどまだビビってChatGPTのWebUIでしか作ってない。

もうちょっとこれを転用すると、Twitter(X)に逐一投稿している人なんかならそれをソースにしつつテキストもソースに使えるし、Instagramなんかもソースにまとめたりできそう?TwitterはAPI従量課金になったけれどエクスポートデータなら使い放題だし過去の漫画生成なんかなら悪くないかもしれない。

ソースはPythonスクリプト1つなので気が向いたタイミングでGitHubに置いておきたい。

昨日も自転車買いに西院だったのだけれど、Mee floatさん見たいなということで今日も自転車で西院に。いい空間でいいライブでした。松尾君完全ソロはわりと初めてかも。

Mee float

松尾湧佑

西洋彦

Lup

10年前に買ったGiantのEscape RX2 2015年モデルをずっと乗っていたけれど、ガタが来てる感あり、昨年修理した際も買い替えたほうがいいと言われていたので、西院まで見に行って、後継のEscape RX2 Disc 2025年モデルの中古を買った。初代はたしかサイズSの在庫で適正身長が160〜175cmなところをなんかステム交換して伸ばして自分でも適正に収まるようにしてもらう感じだったのだけれど、今回はLサイズで適正身長180~195cmということで、ここから身長伸びても大丈夫なくらいになった。ハンドル幅も大きくなったので、土間に入れるための古民家の狭い戸を通すのがやや難易度上がった点もある。なんにせよ、色も大体同じだし近所に在庫があってよかった。

買い替えたとはいいつつもまだ初代を売ったり捨てたりはしてないし壊れていると言うほどでもないので、稀にある客人用に置いておいてもいいかなという感じではある。土間のスペースは一応あるし、さらに玄関先に置くのもできる。

あと、ディスクブレーキモデルということで、雨でもちゃんと止まりやすいらしい。乗った感じではブレーキ音はちょっと気になる感じだったので、メンテナンスしてもらえば改善するのかもしれないという辺少し調べたい。

Codexは普通にコーディングに使いたいし、GeminiはGoogle AI Proでもらえる分のトークンではエージェントぶん回すには心もとないので、OpenClawは、cronの処理が色々モデル代えたりしてると安定しないのでCodexに定期処理のスクリプトを自宅のLM Studio+Qwen3.6 35bでできるようなスクリプトに書き換えてもらい、ベースのモデルもLM Studio使うように設定した。

定期処理といえば、Flickrの自動アップロード写真を解析して日記の草稿を書かせるというのはGeminiにGoogleフォト連携機能が最近追加されたのでそれでもできるようになったしこれでいいと思う。

35bで良い感じだったけれど、なんか27bが出てこっちの方がいいみたいな話も出てきたので昨日乗り換えた。

あとついでにCodexのトークンが切れたときにも備えてOpenCode+LM StudioのQwen3.6 27bでも動く感じの環境は用意できた。

そんな感じでエージェントで最近サクッと作ってるのは、ライブで誰を何回見たかを管理する特化型ブログ風サービスと、Cloudflare AI SearchにTwitter(X)のエクスポートデータ全部ぶっこんでタダでRAGで遊んでみたいというためのスクリプトです。普通に使えそうならリポジトリをpublicにしたい。

今年年始も見逃してみらんさん見れてなかったところにレコ初イベントが近所であるということで、20日はnanoに。最初に地元の同級生であるダウ90000の忽那さんによるインタビューと一緒に歌ったりがありつつ、その後に弾き語りで。インタビューでの話も作品の出来上がり方であったり、今後のやっていく気持ちなんかも聴けたり理解度が深まるよい企画でした。忽那さんにギターを教えるきっかけで最近できたという新曲も聴けたりもして良い催しでした。ボーナストラック盛りだくさんのCDも買えたし。

みらん

みらん×忽那文香(ダウ90000)

花粉症は金曜辺りにおさまった気がする。

履歴 – Home Assistant

春っぽさはだいぶ高まって、窓を開けてちょうどいいくらいにもなってきた。

今期の花粉症は乗り越えたつもりでイたのだけれど昨日あたりからまた強めの花粉症的な症状が来て、鼻炎薬キメてもきつかったので昨晩は早めに倒れ込んだ。そして今日もキツめだったしなんかこれ風邪か?という気持ちにもなってきたので昨年買ったパブロンゴールドを2回目の投与してみたもののあまり変わらず。鼻水が止まらない感も出ていたのでジムも休んで蟄居に。

PXL_20260406_100130276.MP

最近減りがちな柴田聡子さんのライブ見る機会ということでJANUSに。向井秀徳とのツーマン。うかうかしてたら最速チケ購入できてなかったので後ろの方で見た。

セットリストは

  1. HAPPY DAY
  2. ニューポニーテール
  3. いじわる全集
  4. Side Step
  5. 後悔
  6. 雑感
  7. ワンコロメーター
  8. Your Favorite Things
  9. Movie Light

で、最後2曲はグランドピアノで他はギターでの弾き語り。グランドピアノ弾き語り見たの初めてかも?初期のはないけれど結構前作以前のを入れてきたイメージ。未聴の新曲もなかったけど。

向井秀徳さんはアコースティックギター(?)とエレキを使い分けつつ座して弾き語り。音響良かったのもあってよい響きがあった。

アンコールでは柴田さんも出てきてYUIのCHE.R.RYカバーを披露。少しコラボ期待してたけどカバーとは予想外だった。

大体体感と予想通りでしたね。

https://www.pref.kyoto.jp/senkyo/documents/chijikaihyokekka20260405.pdf

このソース食わせてChatGPTにグラフにしてもらった。

京都府選挙分析

全然現職には迫りはしないものの、共産党がまくられるくらい京都でも弱くなっているんだなというのとみんなあんま現状には不満ないんだなということで。

いちやなぎくんが予告していたので、日曜夕方天気が良かったので自転車で三条へ。割とちゃんとポータブルPA的なのも持参しつつしっかりバンドセットで、鴨川沿いや橋の上で人々が聴いていていい京都の風景だった。

いちやなぎいちやなぎいちやなぎ