ブログです oq.la/++
WiteFreelyでタイトルを中国語判定されてだるいのと yyyyMMdd にしたかったのでCodexにいじってもらった。どうか。
その後、いろいろOCR失敗の理由探ってて、画像がでかいのが原因ということがわかった。特にメモリ足りないという感じでもなかったのであまり釈然としてないのだけど、縦2300pxくらいで失敗してたので長辺1200pxにリサイズさせつつOCRするようにしたらうまくいった。解像度足りないとかは可能性ありそうかとは思ってたけど、普通にスキャンしたくらいのサイズでコケてしまうのかあという気持ち。
あとは、引退ゲーミングラップトップにやらせてることもあってページあたり30秒くらいかかってるのでのんびりやってみる。
やや古いゲーミングラップトップのGPUでも動かせそうなGLM-OCRが出てたので、最近はやってないけど自炊していたスキャン済書籍の画像ファイル群をOCRして検索システムでも作ろうかということでollamaで動くようにしつつ、ついでにトークン量が期間限定で増えてるCodexを使ってシステムを作らせてみている。
そんなこんなでシステム自体はサクッと作れたようで、
はなんとなく動きそうな感じ。
あとはOCRをしてデータ突っ込んでいけばいいということで、試してみたらOCRかけて検索エンジンに取り込む部分は1ページ10秒くらいかかっている感じで、これはバックエンドのollamaをメインマシンに切り替えたりすれば早くはなるのだろうけど、特に急いでないしのんびりやらせてみるかと思っていたら、大学時代の教科書をスキャンした縦書きのページの読み取りが全然できすに謎な状態に。漫画はうまくできてたのだけれど、何が悪いのかまだよくわからず。
ということでこれについては気が向いたタイミングで進めていきたい。
10月に24TBのHDDを買って、自宅サーバーにマウントして様々なメディアをまとめられるようになっていたのを書いてなかったので書いておく。
買ったのはSEAGATE ST24000DM001で、6TB HDDと8TB HDDをつないでたところをこれにまとめられつつ、容量にも余裕ができたという感じ。以前退役された4TB HDDもあったりして、中途半端にHDDが余る期になっている。ゆるくバックアップなんかもしておきたい。
というわけで今のところ半分くらいは空いてるので、録画を削除するのをサボりがちで良くない。H.265の時代になってエンコード後のサイズも小さくなったのも助かるし。
そしてそうこうしているうちにRAMの価格上昇につられてHDDやSSDの値段も結構上がってきており、まだ高くなる前に買っておいてよかった。EVO-X2用の追加SSDを買っておかなかったのはやや失敗だったかもしれないけれど。
年末から1ヶ月無料?2ヶ月半額?で試していたGoogle AI Proの月間のサブスクリプション(月額2900JPY)を継続することにした。
https://one.google.com/intl/ja_jp/about/google-ai-plans/
決め手としては、最近Gemini APIをOpenClawとかで使いつつあるので、毎月Google Cloud クレジット$10USD(1年間有効)が配給されるのがちょうどいい気がするのと、それを考慮するとひとつ下位のプランのGoogle AI Plus(月額1200JPY)よりお得に見えるというまんまと意図通りに操られてる感じの思考によってProに。ストレージ容量とか使えるAIのモデルとかGoogle HomeでGeminiが使えるとかPlusとProでは色々違いがあるのだけれど、
の2つだけでプランの差額1700円が大体埋まるので、YouTube Premium使ってGemini APIそこそこ使う予定ならPro選んだほうがいいというやつ。
とりあえず半年くらいは継続するような気がしてるけど、クレジット全然使わない感じだったらPlusとかに落としたりすると思う。その場合YouTube PremiumがProのアドオン扱いなので一旦解約して契約し直す必要あるっぽいけど。逆に完全にGeminiの時代になったらChatGPT Plusの解約が視野に入ってくるがどうか。
あと、この都合で今までのYouTube Premiumは手動で解約しなければいけなかったのだけど1日前にサブスクリプション引き落としされた直後だったので二重課金になるし返金してくれないかと問い合わせたら返金してくれた。
Flickrの自動アップロードから日記を書かせるのと同じような処理として、写真自体にタグを付けておけばあとから処理するのも簡単だよなと思ってやらせてみているやつ。

写真はこれ
Flickrはタグを付けられるのでタグを付けつつ、meta:autotag というタグがあったら処理済扱いにするみたいな感じ。画像を解析してラベリングみたいのはよくあると思うけれど、Flickrのタグとして利用するというのはあんま見かけなかったので。以前はFlickrで自動でタグが付くみたいなお試し実装もあった気がするけれどいつの間にかなくなってたし、今回ほど具体的なタグがつくわけでもなかったので、後々検索に役立つかもしれないという気持ち。サービス全体としては一般名詞については英語で付けた方が検索にも引っかかりやすくていいのだろうけれど、個人の便利さのためなのでなるべく日本語でタグつけてくれとしている。
アップロードしたやつ全部を対象にするとライブの写真を一気に上げたときとかに破滅するのでとりあえずチャットに貼ったURLに対してやるみたいにしている。この処理は普通に後で使いたくなる気もするし、これに限らないけどチャットを経由することで無駄にトークンも消費するというのもあるので、OpenClawに依存しないシェルスクリプトとして切り出しておきたくもなる。そんなわけでお試しの遊び場としてはOpenClawいいと思います。