Issue № 06·06 Recursive Self-Improvement Anthropic Internal Data

AIが、AIを創る。

人間が設計した世代AIが後継機を設計する世代 →

2026年、人類は「発明の主体」という地位を、鏡の中の知能へと譲り渡し始めた。AIが自らの後継モデルを設計・訓練・評価する——再帰的自己改善（RSI）。知能の進化速度は、もはや人間の思考ではなく「計算資源の速度」に依存する。

80%という実証 → 停止ボタン →

80%+

マージされるコードのうち Claude 執筆分 · 2026年5月（25年初頭は1桁%）

8×

エンジニア1人あたり日次コードマージ量 · 2021〜24年比

4ヶ月

AI が自律完了できるタスク長の倍増周期（旧:7ヶ月）

52×

研究最適化での高速化 · Claude Mythos Preview

AIがAIを創る時代：再帰的自己改善（RSI）の全体像インフォグラフィック — **The Map**本ブリーフィングの全体像。生産性の爆発（80%／8倍）→ ループの完結（完全自律訓練）→ 判断力の逆転（64%）→ 未来の3分岐 → 検証可能な一時停止まで、RSI の構造的転換を一枚に凝縮。 · 0606.png

01 · The Shift

知能の主体が、
人間から AI へ移管される。

これまで AI は、人間が設計し・コードを書き・改良を施す「補助ツール」に過ぎなかった。しかし最前線では、AI 自身が自律的に進化のサイクルを回す構造的転換が現実になっている。実装という泥臭い試行錯誤のコストが、ゼロへ収束していく。

〜2025 · 人間主導

人間の労働速度に律速

AI は「補助ツール」

人間が設計図を描き、実装し、評価する。進化の速度は人間の思考速度と労働時間という物理的限界に縛られていた。

2026〜 · AI主導（RSI）

計算資源の速度に律速

AI が「後継機の設計者」

AI システムが自律的に自らの後継モデルを設計・開発・訓練・評価し、性能を連続的に向上させる。進化は計算速度のパラダイムへ移行する。

02 · The Evidence

もう仮説ではない。
80% と 8倍の衝撃。

Anthropic の内部データは、開発の主導権がすでに AI へ移管されたことを冷徹な数値で示す。わずか1年余りで、実装の主役が交代した。

2026年5月Claude が執筆したコード比率

80%+

2025年初頭同・約1年前

〜5%

生産性の爆発。 2026年Q2、エンジニア1人あたりの日次コードマージ量は2021〜24年平均の8倍に急増。ただしこれは LOC（行数）ベースであり量を過大評価する余地はある——が、「実装の汗」を AI が流している事実は揺るがない。

内部データが示すAIによる開発の掌握：80%と8倍 — **Exhibit 02**内部データが示す「AIによる開発の掌握」——マージコードの80%以上が Claude 製、エンジニア1人あたりのコードマージ量は8倍へ。実装の主役交代を裏づける資料ページ。

03 · Exponential Acceleration

能力は、約4ヶ月で倍増する。

AI が自律的に完了できるタスクの「長さ」は、従来の「7ヶ月で倍増」から現在は「約4ヶ月で倍増」へと、倍増のペースそのものが加速している。時間の密度が、根本から変容した。

12時間 2024年に「4分」相当だったタスク遂行能力が、
2026年3月時点で「12時間」相当へ。

20244分相当

2025数十分〜数時間

2026.0312時間相当

2026 →丸1日 → 数日へ

— 倍増周期: 7ヶ月 → 約4ヶ月へ短縮 —

圧倒的なコード寄与率と4ヶ月での倍増 — **Exhibit 03**圧倒的なコード寄与率と「約4ヶ月での倍増」。自律的に完了できるタスク長が指数関数的に伸び、時間の密度そのものが変容していく。

04 · Amdahl's Law Returns

新たなボトルネックは、
人間の「判断」になった。

システム全体の速度は最も遅い工程に律速される——アムダールの法則。実装と実験がほぼゼロコスト化した結果、最大のボトルネックは皮肉にも人間の「認知の帯域幅」へ移った。既存の物差しは、次々と飽和していく。

SWE-bench

実世界のSWE能力

計測開始2年で飽和

CORE-bench

研究の再現能力

計測開始15ヶ月で飽和

64%

実装コストが消えた世界で人間に残された最後の資本は、どの問題に解く価値があるかを見極める「研究センス」だった。だが内部調査では、研究の「次の一手」を提案する場面で、最新モデル（Mythos Preview）が64%の確率で人間の判断を上回るシグナルが確認された。
※「人間の選択に改善余地があった場面」を抽出したテスト結果。聖域すら安泰ではない。

最後の砦『研究センス』への侵食と64%の判断力 — **Exhibit 04**最後の砦「研究センス（Research Taste）」への侵食——アムダールの法則でボトルネックが人間の判断へ移り、最新モデルが研究の次の一手を64%の確率で人間より最適化。

05 · Three Futures

停滞か、共生か、
知能爆発か。

RSI の進展が辿りうる未来は、大きく3つのシナリオに集約される。私たちは今、シナリオ2から3への入り口に立っている。

S-curve

Sカーブによる停滞

電力・チップ・現行アーキテクチャの限界で、進歩が物理的に頭打ちになる。

変化と含意ペースが緩和され、社会制度が適応するための時間を確保できる。

Symbiosis

複合的な効率向上

人間が方向性を設定し、AI が圧倒的速度で実行する強力な共生。組織効率の極大化。

主戦場の移動サイバー防御が「脆弱性の発見（自動化）」から「パッチ適用の速さ」の勝負へ。

Intelligence Explosion

完全なRSI（知能爆発）

進歩のペースが計算資源の量にのみ依存。知能が自律的に自己を再生産する。

欺瞞的整合性のリスク初期の微細なミスアライメントが世代交代ごとに指数関数的に増幅し、人間に不可視なまま制御不能へ。

最も警戒すべきは「エラーの継承」。AI が後継機を構築する過程で、初期のズレが世代を重ねるたびに増幅される。

**Exhibit 05**分岐点：3つの未来シナリオ。Sカーブによる停滞／複合的な効率向上（共生）／完全な RSI（知能爆発）——私たちはシナリオ2から3への入り口に立つ。

06 · The Stop Button

人類が保持すべきは、
検証可能な「停止ボタン」。

知能のバトンが AI へ渡りつつある今、人類に残された最も重い責任は、そのプロセスを「検証」し、必要なら「停止」できる能力を維持することだ。Anthropic は、国際合意に基づく「検証可能な一時停止（Verifiable Pause）」を提言する。

核軍縮との決定的な違い。 かつての INF 条約は、ミサイルサイロという衛星から視認できる物理的実体を対象にできた。だが AI の訓練（トレーニングラン）は、汎用データセンターの中に容易に隠蔽できる。

時間が、もう足りない。 INF のような枠組みの構築には数十年を要した。しかし「4ヶ月で能力が倍増する」現代のタイムラインに、数十年もの猶予は残されていない。抜け駆けや隠密開発を許さない国際的な検証レジームが要る。

プロフェッショナルへ。 再定義すべきは「AI をどう使いこなすか」という技術論ではなく、「AI が創る未来の安全性をいかに検証し、人間として責任をどう果たすか」という統治論だ。

提言の骨子Verifiable Pause

◆検証可能な一時停止を選択肢として構築。単一企業の倫理的判断に委ねない。
◆国際的な検証レジームで抜け駆け・隠密な開発を許さない枠組みを。
◆訓練ランは DC 内に隠蔽可能——核兵器と違い物理的検証が効かない。
◆保持すべきは加速のアクセルではなく、確実かつ検証可能な停止能力。

トップランナー自身が求めるブレーキペダルと検証可能な一時停止 — **Exhibit 06**トップランナー自身が求める「ブレーキペダル」。国際的な合意による検証可能な一時停止（Verifiable Pause）——「汗」は自動化できても「判断」は人間の手に。

最後に保持すべきは、
アクセルではなく
「停止ボタン」。 Recursive Self-Improvement — 2026·06·06

From the Briefing

技術ブリーフィング、抜粋。

本スライドの元になった解説資料より。研究サイクルの加速、2つの速度の衝突、そして「我々のガバナンス」という最終テスト——RSI を読み解く視点の要点。

真のボトルネックは我々のガバナンス — 結論真のボトルネックは「我々のガバナンス」

Sources / References

出典と関連リファレンス。

本スライドは Anthropic の内部データに基づく RSI 解説資料を再構成したもの。確定情報は一次資料での裏取りを推奨する（内部データの一部は要確認）。

01 Anthropic — 公式発表・研究再帰的自己改善、コード寄与率、能力スケーリングに関する一次情報の確認先。 → 02 SWE-bench — 実世界SWEベンチマーク「2年で飽和」の根拠。実環境のソフトウェアエンジニアリング能力の評価系。 → 03 CORE-bench — 研究再現性ベンチマーク「15ヶ月で飽和」の根拠。計算論的研究の再現能力を測る評価系。 → 04 METR — タスク長の倍増則AI が自律完了できるタスク長が一定周期で倍増するという計測の背景研究。 → 05 Recursive Self-Improvement — 概念整理RSI・知能爆発・整合性問題の基礎概念。シナリオ分岐の理論的背景。 →