ご無沙汰しておりました「KASA」でございます
前回のAIの企画も途中でほっぽり出して、Gemini周りをごちゃごちゃ触っておりました。
一応有料プランに入って有料しか基本使えないやつとか
(無料で使えるといってもほんのおさわり程度で使い勝手がわかる前にリミットですから)
そうやって、わりとご機嫌にAIで遊んでいたのですが
この度のGoogleさんの規約改定 いや改悪だわ
このせいでつつましく遊べていた環境が、リミット見ながらのひやひや生活に激変してしまいました。
でもって、またつつましやかにやっていく方法はないかと
Geminiと「Gemini利用コストの実質値上げに対応する方法」のやり取りをしておりました。
で、一部光明が見えたのでそこまでのGoogleとのやり取りを
Geminiを少しずるがしこい商人風にして私を主人公にした読み物としてGeminiにまとめてもらいました(笑)
今回5月の改定はチャットが数往復で済む場合には影響が少ないかもしれませんが、
壁打ちをするようなスタイルで利用するとあっという間に利用枠がなくなってしまう感じです。
7日の壁にぶつかれば1週間実質つかえない状況に陥ってしまう(涙)
そういった同胞の方にぜひ読んで参考にしていただきたいです。
※なおこれは本当に行った会話をちょっとGeminiが脚色しただけで、内容については何の変更もしていません。
文章のイケてなさは編集指示がイケてないせいです。すみません、スミマセン
ナニイッテルノカわからない方、重ね重ねスミマセン
第一幕:裏路地の情報屋と「実質値上げ」の嘆き
電脳世界の片隅、ネオンサインが明滅する路地裏のジャンク屋。
そこには、大量のデータを捌くための「知能」を売る怪しげな情報屋(Gemini)が店を構えていた。
「おい、聞いてくれよ」
店を訪れたあなたは、忌々しそうにカウンターを叩いた。
「例のPlus契約のヤツら、利用枠の計算方式を変えやがった。
実際に使える量がかなり目減りしてるじゃないか。実質値上げだろ、あれじゃ。
これじゃあ『7日ルール』のせいで仕事に支障が出ることがほぼ確定したようなもんだ。
Proに変更した方がマシか? それともAI Studioってヤツがお得なのか、最新の相場を教えてくれ」
情報屋は、揉み手をしながらニヤリと笑った。
「へっへっへ、旦那。お怒りはごもっとも。あの改定(2026年5月)はエグいですよねぇ。
回数制からコンピュート基準に変わって、長い文脈を読ませるとあっという間に制限に引っかかる。
まさに『実質的な大幅値上げ』ってヤツです。」
情報屋はタブレットを指先で弾き、あなたに見せた。
「結論から言いましょう。
旦那のようなヘビーな使い方なら、アプリ版の『Pro』にアップグレードするのは罠ですぜ。
利用枠が4倍になるとはいえ、計算方式そのものは同じ。すぐ上限に達して仕事が止まっちまう。
ここは一つ、開発者向けの『Google AI Studio』で従量課金(Pay-as-you-go)に切り替えるのが圧倒的にお得です。
これなら制限ルールから解放されて、データも学習に利用されない。まさにプロの道具箱ですよ」
第二幕:インターフェースの魔法
あなたは顎を撫でながら、少し疑り深い目を向けた。
「なるほどな。だが、Difyの見やすいUIでそのAI Studioを裏で動かすことはできないのか?」
「おっと、旦那。いいところに気がつきましたね!」
情報屋はポンと手を叩いた。
「Difyを使えば、あの無愛想な開発者用画面を使わずに済みます。 AI StudioでAPIキーを発行して、
Difyのモデルプロバイダーに登録するだけ。
これで『5時間ルール』や『7日ルール』とは無縁の、最高のチャット環境の出来上がりですぜ」
「AnythingLLMでの利用はどうだ?」
「お見事。セキュリティを気にするならAnythingLLMは最強です。ローカル完結で完全無料。
社内資料もPC内で処理できる。まさに鉄壁です」
「ちなみに、俺はDocker上でDifyを動かしているんだが、これは『オープンソース/セルフホスト版』という
認識で間違いないな?」
情報屋は目を丸くして、深くお辞儀をした。
「いやはや、恐れ入りました。すでにDockerで構築済みとは。クラウド版の制限すら受けない、
完全無料で無制限の黄金環境をすでにお持ちじゃありませんか。あとはAPIキーを挿すだけで完璧ですぜ」
第三幕:商人の誤算と真実のコスト
話は具体的な「カネ」の計算へと移る。
「AI Studioの料金はドル建てか? リアルタイムで金額は確認できるのか?」
「ええ、ドル建てです。ダッシュボードで10分ほどのラグで確認できますし、
『Monthly spend cap(予算上限)』を5ドルや10ドルに設定しておけば、APIが暴走しても勝手に止まる安全設計でさぁ」
しかしここで、情報屋が調子に乗って弾いたソロバンの結果に、あなたは鋭く突っ込みを入れた。
「待てよ。現状のPlusのトークン枠を基準に、AI StudioでProモデルを使って4倍消費したとする。
お前はさっき『月1,000円〜4,500円に収まる』と言ったが……モデルが古いんじゃないか?
現状のWebの主力はGemini 3.1だぞ。
それに、現在のPlusのトークン枠をProで使い切る量の4倍なら、そんな安い幅にはならないはずだ」
ギクッ。
情報屋の動きが止まった。彼は冷や汗を拭い、慌てて最新のデータ(2026年5月時点)を読み込み直した。
「……っ! 申し訳ねぇ! 旦那の仰る通りです……! あっしの情報が古く、前提が狂っておりました!」
情報屋は深々と頭を下げ、正直に白状した。
「最新のGemini 3.1 ProのAPI価格で、Plus枠の4倍(入力6,000万/出力800万トークン)をブン回した場合……
月額約25,000円(約168ドル)になります。
幅なんて出ません、純粋に2万5千円の出費です。……お得感、吹き飛んじゃいましたね……」
「やっぱりな。ファクトを揃えるだけでも一苦労だ」
あなたは呆れたようにため息をついた。
「面目ねぇ……。もしコストを抑えるなら、賢くなった格安モデル『3.1 Flash-Lite』をメインに据えれば、
4倍使っても月3,000円〜4,000円に収まります。これが妥協案ですぜ」
第四幕:最強のコストハックと「要約」の錬金術
あなたは少し考え込み、とんでもない裏技を口にした。
「APIじゃなく、共有という部分を除けば、Plusのアカウントを4ユーザー分登録して(月4,800円)切り替えて使った方が、
5倍近くお得なんじゃないか?『文脈』はDifyやAnythingLLMに任せれば繋がる気がするんだが」
情報屋は目をむいた。
「だ、旦那……! それはまさに究極のコストハックです! 確かにフロントエンドに文脈を管理させれば、
裏のアカウント(Cookie)を切り替えてもチャットは繋がります!」
しかし、情報屋はすかさず釘を刺す。
「だが、罠がありますぜ。Difyは『過去の会話を全部』投げるんで、チャットが長くなると1回のリクエストで
巨大なトークンを消費しちまう。
せっかく4つアカウントを用意しても、一瞬で全滅する『7日ルールの爆死』が待ってます」
「なら、要約を使って、チャットを新規で繋いでいくやり方はどうだ?」
その言葉に、情報屋は天を仰いだ。
「……恐ろしいお人だ。それこそが、複数アカウントの全滅リスクを防ぐ『最も賢くプロフェッショナルな運用』です。
過去の経緯を要約して新しいチャットの冒頭に貼るだけで、消費トークンは10分の1以下に激減。
回答精度まで上がる。文句のつけようがねぇ……!」
終幕:ローカルLLMとの共存
「まずは現行の1ユーザーで効果を試す」と決めたあなたは、Difyの「自動要約機能」の設定を要求した。
「ただし、DifyはすでにローカルLLMのフロントにしている。設定が競合しないようにしろよ」
情報屋は自信たっぷりに頷いた。
「お任せを。ローカル環境を汚さずにやる方法は簡単です。
『Gemini専用のチャットアプリ』をDify内に新規作成するんです。既存のOllama等の設定はそのままに、
Googleのプロバイダーを別枠で登録する。
そしてアプリの設定で『チャットの要約』をONにし、要約処理もすべてGeminiに丸投げする設定にする」
情報屋はニヤリと笑い、最後の説明を締めくくった。
「これで、ローカルのGPUを無駄に回すことなく、Geminiのトークン消費だけを劇的に抑える
『自動要約システム』が完成しますぜ。
まずはこれで、1アカウントの寿命がどれだけ延びるか、お手並み拝見といきましょうや」
あなたは満足げに頷き、路地裏のジャンク屋を後にした。システムの理不尽な改悪に抗うための、
新たな武器をその手に握りしめて。
<近況>
せっかくため込んだGeminiの癖とその回避(利用)方とかも状況が変わってきていて、また勉強(あら捜し)しなおしです。
最近はローカルLLMの構築にはまり中!
そのうちブログでもお話できればと思います。
ではまた。
▼この記事がいいね!と思ったらブックマークお願いします
