2026年6月のwhywaitaのAI現在地

2026年6月時点のAIの現在地をメモしておく。目まぐるしく状況が変わるので定期的にメモしたいのだが、AIでやりたいことが多すぎてメモに時間が割けない。業務と個人の話が混ざっているので、うちの会社全体がこうというわけではない。オチはないです。


Claude Codeをベースに使っていたが、人間やラップトップがボトルネックになるのは早々に見えてきた。ヘッドレスでAIが色々やってくれる基盤を作れないかと考え、STORESさんのkuroがまさに欲しかったものだったので一旦その方針でいこうと思っていた。

ところが記事を読んだ2日後くらいにhermes-agentを知って、当時の @about_hiroppy さんの構成(hermes-agent + Symphony + Codex)を自宅サーバ + whywaita Discordで組み運用し始めた。LLMはOpenCode Goで月10ドルにケチっている。

2026年4月にその構成を作ってから割と変遷しているが、基本シンプルで、OpenCode Goに新モデルが来たらそっちに切り替えている。もちろんSSHせずhermes-agentに依頼して切り替えさせている。いまはDeepSeek-V4-Flashと、コーディングだけGLM-5.2で回している。Symphonyは完全に使っていないのでこの後削除予定。

自分はTODO管理や並行して仕事するのに苦手意識があるので、hermes-agentが自然言語でリマインドしてくれて、かつタスクを軽くやってくれるのはだいぶ助かっている。

一時期と比べるとhermes-agentの登場により手元でClaude Codeを走らせる機会は減っていて、3並列くらいで必要なタスクだけ手元で走らせている。 主にkubectlなど手元で認証認可してクラスタを操作しながらコードを書いたり動作テストさせるときがメイン。Codexはcodex review用途が多く、ゲームエンジンを作っている時にガチガチにテストを書かせたりしている。

hermes-agentによって気になったものを開発するのがさらに低コストになったので、自分向けのソフトウェアをバンバン量産している。カードゲーム用ソフトウェア、AI agent nativeな○○クローン、自宅にM5Stackで天気表示するやつ、など。macOS/iOSアプリも作ったけど一瞬で放置。また思いついたら作るだろう。

現状のネックはデリバリ部分。個人向けならCloudflare Workersや自宅サーバのシンプルデプロイ基盤に放り投げている。業務ではE2Eをカリカリ書かせてメンテさせつつデプロイしやすいよう心がけているが、Webアプリより副作用の痛みが激しくbad codeの影響も大きいので、どこまでやるべきか悩ましい。

その昔@netmarkjpさんや@rrreeeyyyさんが「Webサイトの監視は最終的に外からの振る舞いだけを見る世界がくるかも」と言っていたのを思い出しつつある。ソフトウェアも振る舞いを強く監視し続けるだけになるかもなと思いながらやっている。

人間がタスクを依頼してやってもらうところはモデルの成長でどんどんできるようになると思うので、AIがやるべきことを自分で発見できるようにすべきだと思い色々試している。シンプルにcronjobで探索させるところから始めていて、コードやドキュメントのスコアリング的なものを進める必要がありそうで先週くらいから手を動かしている。

会社でOpenAI Compatible APIをvLLMで運用していることもあり、モデルの進化にはアンテナを高くしてキャッチアップしている。GLM-5.2やKimi K2.7 CodeあたりはOpenCode Goサブスク + hermes-agentで動かす分にはだいぶ満足。

とはいえ原価を考えると継続性があるかは怪しく、そこまで楽観的ではない。オープンウェイトモデルのテストは昔OpenHandsを使っていたが、プロダクトの方向性的にOpenCodeのほうが筋が良さそうなので興味は移っている。ollama with Codexなどを見るとCodexでもええんかなと思いつつ、Responses API対応を見るとちょっと悩ましい。どうせ今後もアップデートは続くだろうし。opencodeが元気なのは本当にすごい。

今の様子を見ていると、今すぐソフトウェアエンジニア廃業とはならなさそうだが、いつかの未来にはなくなる仕事になりつつあるかなとは思う。いまソフトウェアエンジニアをやっている人の仕事がなくなるわけではなく、仕事がシフトするのだと思う。

ただしそれが半年後なのか来年なのか10年後なのか100年後なのかはわからない。直近半年を振り返ると、なんだかんだゼロになるには時間がかかるかもという気はするが、個人としては切迫感はある。やるだけです。