1四半期の発展を経て、モデルもエコシステムも新たな高みに達した。
しかし、昨年9月に書いた 誰もがプログラムを書ける:Vibe Coding と問題のスケール は、今振り返っても依然として正確だ。
もちろんこの3ヶ月で、以前よりもさらに Vibe coding 的になった。では、新しいインサイトについて話そう。
銀の弾丸はない
ほとんどの解決策には標準解がなく、ソフトウェアエンジニアリングでは常にトレードオフが求められる。
意思決定に必要なドメイン知識を AI はすでに持っているが、AI はあなたの代わりに決断してくれるわけではない。たとえすべての判断要素をコンテキストに詰め込んでも、完全に定量化することはできない(ましてや、AI が本当に定量化してくれるとも限らない)。
だが、AI は選択肢を提示し、それぞれの選択肢の妥当性を説明してくれる。これが意思決定を助けてくれるのだ。
初級エンジニアの終焉
純粋なジュニアプログラマーは、まるで紡績工のような存在となり、つまり未来には存在しなくなる。
「ジュニアプログラマーがいなくなったら、どうやってシニアプログラマーに成長するの?」と聞かれるかもしれない。心配はいらない、シニアプログラマー自体が不要になるのだ。新しい紡績工場に「熟練紡績工」がいないように、工場のエンジニアは紡績工から昇進したわけではない。
初級プログラマーは消えても、新しいパラダイムが生まれる。そのパラダイムを扱える人材は依然として必要で、求められる中核能力が「要件をコードに翻訳する」から「定義と受け入れ基準を策定する」「問題を深く修正する」に変わっていく。
もちろん、工場の熟練技術者はそれほど多くはない。以前の紡績工ほどにはならないだろう。
重剣無鋒、大巧不工
Codex(gpt-5.2-high、-codex サフィックスなし)と Claude Code(Opus 4.5)を集中的に比較して使ってみると、良い基盤モデルはやはり強いことがわかる。
機能や使い勝手では Claude Code が Codex を圧倒しているが、Codex は Claude Code が見逃すバグをレビューで見つけ、根本原因を突き止めることができる。
同じコードを使って相互レビューを行う「決闘」では、Claude Code のレビューは Codex に問題を指摘され、Codex のレビューは Claude Code に完璧に通る。
日常の開発でも同様で、Claude Code は表面的にしか問題を見ない傾向があるが、Codex はより深く掘り下げて考える。
Codex の唯一にして三つの欠点:遅い、フロントエンドと UI のドメイン知識が弱い、美的センスが悪い。
デバッグは尋問へと変わる
コードロジックがある程度複雑で、AI によって生成されたものである場合、私はある部分のコードに対して Codex を「容疑者」と見なし、diff を見ながら問い詰める。
「ここで並行処理はちゃんと考慮した?」「API が空を返したらこのロジックは落ちない?」「なぜこのライブラリを使って、あっちは使わなかったの?」
こうして私は「整備工」から「検察官」へと変わった。
多くの場合、直接手を入れて修正するのではなく、論理的な尋問を強く行って AI に思考の穴を暴かせる。おそらくこれは、Codex のような「遅い思考」のモデルがレビューで無二の存在である理由だ。尋問に耐えられるのだ。
コーディングを超えて
Claude Code が誕生した時点から、私はそれを使って PC のファイル整理をしていた。たとえば PDF の内容を読み取り、内容に基づいてファイル名を一括変更する、という具合に。
その時感じたのは、「これは低性能版 Jarvis みたいだな」ということ。結局この世界も、プログラムのランタイムで動いているのだから。
その後、Anthropic の Agent SDK が Claude Code に依存している ことを知った。これは「天地逆転」か? いや、そうでもない。
私はこう思う。Coding Agent は General Agent の初期形態なのではないか。すでに Anthropic によって検証されているし、試してみる価値がある。
コードは人間の論理の産物から、世界を操作するミドルウェアへと変わる。
もはや「コンピュータに実行させるためのプログラム」を書くのではなく、AI にコードを生成させ、この世界を動かすための「要件」を書くのだ。
AI 対人間
今や Agent が第一級の存在となった以上、ソフトウェアの最終的な納品先はもはや人間ユーザーだけではなく、Agent ユーザーでもある。
これまでプロダクトマネージャーは UI の美しさや操作の滑らかさを重視してきた。しかし今では、人間の認知負荷を下げるために設計されたすべての要素が、Agent の作業を妨げる障害になっている。
なにしろ、ユーザーが一秒間に数万トークンを処理できる AI である場合、彼らに CSS は不要で、必要なのは正確な JSON と確定的なロジックだけだ。
これからは「Agent のためのサービス」が多数必要になるだろう。