2026年5月8日の振り返り — ゴールと評価関数、そしてエージェント経済

今日は手を動かす量より、頭の中を整理した一日だった。Claude Code に作業を渡すたびに「もう一声」と言い続けて修正指示が止まらなかった原因が、自分の側に評価関数がないからだと言葉にできた。同じ日に、エージェント経済を真正面から取りに行っているCloudflareの決算で株価が18%落ちた。課金単位の転換を仕掛けている会社が、自社の人員も20%削った。なぜ売られたかを書き起こしたら、自分の仕事の話とつながった。

今日の3つの発見

1. ゴールだけでは作業が終わらない — 評価関数を持つ

朝、ふと口に出た。「人に求められる能力は、いかに解像度高くゴールと評価関数を提示できるかになった感。それ以外は全部AIでやれる。」

「解像度の高いゴール」は前から言われていたから、ここは変わっていない。変わったのは、評価関数まで自分の側で言語化できないと作業が一生終わらないということ。

評価関数がない状態でAIに作業を渡すと、こうなる。

何度生成しても「なんとなく違う」と返してしまう
自分でも何を求めているかわからないまま、修正指示を出し続ける
永遠に作業が終わらない、ずっと消化不良
AIにフィードバックが渡らないから、改善方向も見えない

簿記3級コンテンツとExcelコンテンツを作っていて、これに何度もハマった。「学べたとみなす」評価関数を最初に書き出すべきだった。たとえばこう。

演習を用意し、それがクリアできれば学習が成立した、とみなす
ExcelデータをユーザーがWeb上にアップロードして、何らかの判定が完了する
そのフローを完了させられるだけのコンテンツがWeb上に揃っている

これを最初に書いてから着手すれば、止め時を決められる。後で見返す用に独立記事にした。

詳細: ゴールと評価関数 — AI時代に人間に残された仕事

2. Cloudflare決算 — エージェント1体=1課金の会社が人を1,100人切った

夜、X(Twitter)を眺めていたらCloudflareの株価チャートで右端が崖になっていた。

Cloudflare(NET)株価チャート — 引け256.79から時間外209.67へ-18.35%急落

引け値 $256.79(+3.30%)から時間外で$ 209.67(-18.35%)へ、$47.12 落ちた。決算は売上もEPSもガイダンスも全勝のビートアンドレイズ。なのに18%下げた。

調べたら、引き金はCEO Matthew Princeの「従業員の20%、1,100人を削減する。エージェント型AIが理由だ」という発表だった。投資家は2つのシグナルを同時に読んだ。

短期(ベア): Cloudflare自身がAIで人を減らせるなら、Cloudflareの顧客企業も減らす。エンタープライズSaaSの席数が縮む。Zero TrustやSASEの売上鈍化が来る。
中長期(ブル): Cloudflareは「人間1人=1課金」から「エージェント1体=1課金」への転換を仕掛けている。x402決済プロトコル、Web Bot Auth、Stripe連携でのエージェント自動契約 — エージェント経済のインフラを取りに行っている。

両方が同時に真。だから合理的な投資家は一旦ポジションを捨てて、エージェント売上が決算数字に出てから戻ってくる。ナラティブの正しさと、ポジションを持つべきかは別問題。

「エージェント経済が本物なら数字に出るはず、それまで投資家は一旦降りる。合理的だけど切ない反応だな」と思った。自分が日々Claude Codeに仕事を渡している風景と、Cloudflareの決算が同じ地続きの話に見えた。

詳細: Cloudflare ($NET) 2026年Q1決算と株価反応

3. Claude Code 自身のアップデート — 公式ネイティブインストーラーの挙動

途中、Claude Codeのバージョンを推定で口走って外した。実プロセスのバージョンを確認するには環境変数を見ればよかった。

# 実プロセスのバージョンを直接確認
echo $env:AI_AGENT
# claude-code_2-1-132_agent

ついでに自分のセットアップを整理した。

mise/Volta管理ではなく、公式ネイティブインストーラーで運用している
更新は irm https://claude.ai/install.ps1 | iex を叩くだけ
autoUpdate: false でも手動更新は問題なく動く
インストーラーはディスク上のバイナリを書き換える。実行中のセッションは古いバイナリで動き続けるので、新セッションを起動して初めて 2.1.132 が反映される

「自分のバージョンを推定で答える」をやめて、$env:AI_AGENT を見る癖をつける。これも一種の評価関数(検証可能な事実に当たる)だった。

今日のつながり

3つの話は別々に始まったが、結局同じ場所に着地した。

評価関数の話: 人間がAIに渡す前に、止め時の基準を言語化する
Cloudflare決算の話: 投資家がCloudflareに渡す前に、エージェント収益の数字が出るのを待つ(これも評価関数の話)
Claude Codeのバージョン推定外し: 自分の中の「たぶん」で動かず、$env:AI_AGENT という事実に当たる(これも評価関数の話)

全部、「なんとなく」で進めずに停止条件・確認条件を持つという同じ原則の別バリエーションだった。

自分への戒め(改めて)

AIに作業を渡す前に、評価関数を自分の言葉で言えるか確認する
言えないなら、まず評価関数を作る作業から始める
「たぶんこのバージョン」で答えない、$env:AI_AGENT のような事実に当たる
投資判断と同じで、ナラティブの正しさと「今ポジションを持つか」は別

頭の切り替えがすぐにはできないところだから、ここに置いて何度も戻ってくる。