AI Intelligence HubCodex Setup
Codex Setup Playbook / 2026-03-08

Codex は、指示ファイルより harness を設計する。

X上でCodexまわりに共有されている実践とOpenAI公式を合わせると、Codex構築の本質は 「長い AGENTS.md を書くこと」ではなく、並列実行、分業、技能化、監督しやすい harness を作ることにあります。 つまり Claude Code よりも、マルチエージェント前提の運用設計が主役です。

01AGENTS は目次

百科事典ではなく、どの docs を読むべきかを示す目次として使う。

02Worktree 前提

並列エージェントを回すなら、最初から worktree と分業ルールを考える。

03Skill 化

繰り返す作業は個別の skill にし、PRごとに毎回長文で説明しない。

04監督中心

Codex は1体を細かく操るより、複数体を監督する設計が合う。

Verdict

Codex 構築の答えは、単独ツール最適化ではなく agent-first です。

OpenAI公式は multi-agent workflows、skills、automations、worktrees を強く押しています。X上でもCodexは「1回で完璧に書かせる道具」ではなく「複数の並列タスクをさばく指揮所」として語られています。

1. 入口は CLI か App

npm i -g @openai/codex で CLI、あるいは Codex app で始める。並列タスク運用なら app の価値が高いです。

OpenAI公式CLI / App

2. AGENTS.md は目次化する

重要 docs、コマンド、ルールへの入口だけ書く。詳細は docs に分ける。OpenAI公式の harness engineering と一致します。

Harness EngineeringTable of Contents

3. 並列役割を先に決める

実装、レビュー、テスト生成、調査などの役割分担を決めると、worktree と skills が生きます。

multi-agentworktree

4. routine は skill 化する

レビュー、docs 更新、incident summary など、繰り返す仕事は skill に落とした方が Codex の運用品質が上がります。

skillsautomation
Blueprint

Codex の推奨最小構成

Codexは単独プロンプトより、リポジトリ構造と並列作業のしやすさで差が出ます。

ファイル構成

repo/
  AGENTS.md
  docs/
    01-product.md
    02-architecture.md
    03-commands.md
    04-review-rules.md
  codex/
    skills/
      review.md
      test-plan.md
      release-note.md
  scripts/
    test.ps1
    lint.ps1
    format.ps1

AGENTS.md の推奨テンプレート

# What this repo does
- プロダクトの役割

# Read these first
- docs/01-product.md
- docs/02-architecture.md
- docs/04-review-rules.md

# Commands
- test: npm test
- lint: npm run lint
- format: npm run format

# Guardrails
- 変更理由を必ず要約
- PRには影響範囲を明記
- 依存追加時は理由を書く

# Multi-agent split
- implementer: 実装
- reviewer: 差分レビュー
- tester: テスト観点整理
Steps

Codex 構築はこの順で作ると安定します。

Codexは機能が広いので、設定より運用単位で作る方が失敗しません。先に surface、approval、documents、parallel roles を決めるのが正攻法です。

Step 1

surface を決める

まず CLI で始めるか、Codex app で並列タスク前提にするか決めます。小規模なら CLI、大量並列なら app が向きます。

Step 2

approval mode を固定する

初期は保守的に始める。古いCLI紹介でも Suggest / Auto Edit / Full Auto の差が重視されており、最初からフル自律は避けるべきです。

Step 3

AGENTS.md と docs を分離する

OpenAIの harness engineering では、巨大な instruction file より table of contents 型が推奨です。詳細は docs に逃がします。

Step 4

worktree 前提で役割分担する

実装、レビュー、テスト、調査の担当を分ける。Codex app も built-in worktree support を前面に出しています。

Step 5

繰り返す仕事を skill 化する

コード理解、eval、レビュー、ドキュメント更新などは毎回会話で説明せず、skill として残します。

Step 6

routine は automation に移す

issue triage、alert monitoring、CI/CD 補助のような定期仕事は、手動で安定してから automation に移すのが自然です。

Workflow

Codex は1体を鍛えるより、3役に分ける方が使いやすい。

OpenAI公式の multi-agent 強調と、X上の現場感を合わせると、Codex は監督型の使い方が一番ハマります。

Implementer

実装担当。feature、refactor、migration などを進める主エージェントです。

  • worktree を分ける
  • AGENTS.md と docs を読む
  • 変更理由を要約する

Reviewer

差分レビュー担当。意図、依存、テスト不足、影響範囲を評価します。

  • PRレビューを自動化しやすい
  • skills と相性が良い
  • 本番前の品質底上げに効く

Ops / Routine

issue triage、alert monitoring、docs 整理のような routine work 担当です。

  • automation 候補を見極める
  • Slack 連携や routine work と相性が良い
  • 開発者の集中時間を守る
How To Configure

Codex はこの3層で設定すると分かりやすいです。

いまのおすすめは、AGENTS.md を目次にし、詳細を docs/、繰り返す仕事を skills/ や automations に分ける構成です。

AGENTS.md

何の repo か、何を読むか、主要コマンドだけを書く。

docs/

設計、レビュー基準、runbook を分けて置く。長文はここに逃がす。

skills/ / app Automations

routine work を codify して、並列エージェントや定期実行へ渡す。

Mistakes

Codex 構築でやりがちな失敗

Claude Codeとは別の落とし穴があります。Codexは構造と役割を曖昧にすると強みが消えます。

AGENTS.md を百科事典にする

OpenAI公式は、巨大な instruction file がタスクや relevant docs を押し出すと説明しています。目次化が基本です。

parallel 前提なのに単独運用する

worktree や app を使わず、全部を1スレッドに押し込むと Codex の価値が半減します。

skill と automation を早く入れすぎる

routine が安定する前に自動化すると、間違った手順が固定化されます。まず手動で勝ち筋を作るべきです。

Sources

参照した X と OpenAI 公式

2026年3月8日時点で確認できた範囲です。Codex固有の構築論はXよりOpenAI公式の比重が高いため、公式ソースを主軸にしています。

Next Action

Claude Code 側は、もっとミニマルです。

Codex が parallel-first なのに対して、Claude Code は minimal context-first の設計が効きます。