Codex Setup Playbook / 2026-03-08

Codex は、指示ファイルより harness を設計する。

X上でCodexまわりに共有されている実践とOpenAI公式を合わせると、Codex構築の本質は「長い AGENTS.md を書くこと」ではなく、並列実行、分業、技能化、監督しやすい harness を作ることにあります。つまり Claude Code よりも、マルチエージェント前提の運用設計が主役です。

最小構成を見る構築手順を見る出典を見る

01AGENTS は目次

百科事典ではなく、どの docs を読むべきかを示す目次として使う。

02Worktree 前提

並列エージェントを回すなら、最初から worktree と分業ルールを考える。

03Skill 化

繰り返す作業は個別の skill にし、PRごとに毎回長文で説明しない。

04監督中心

Codex は1体を細かく操るより、複数体を監督する設計が合う。

Verdict

Codex 構築の答えは、単独ツール最適化ではなく agent-first です。

OpenAI公式は multi-agent workflows、skills、automations、worktrees を強く押しています。X上でもCodexは「1回で完璧に書かせる道具」ではなく「複数の並列タスクをさばく指揮所」として語られています。

1. 入口は CLI か App

npm i -g @openai/codex で CLI、あるいは Codex app で始める。並列タスク運用なら app の価値が高いです。

OpenAI公式CLI / App

2. `AGENTS.md` は目次化する

重要 docs、コマンド、ルールへの入口だけ書く。詳細は docs に分ける。OpenAI公式の harness engineering と一致します。

Harness EngineeringTable of Contents

3. 並列役割を先に決める

実装、レビュー、テスト生成、調査などの役割分担を決めると、worktree と skills が生きます。

multi-agentworktree

4. routine は skill 化する

レビュー、docs 更新、incident summary など、繰り返す仕事は skill に落とした方が Codex の運用品質が上がります。

skillsautomation

Blueprint

Codex の推奨最小構成

Codexは単独プロンプトより、リポジトリ構造と並列作業のしやすさで差が出ます。

ファイル構成

repo/
  AGENTS.md
  docs/
    01-product.md
    02-architecture.md
    03-commands.md
    04-review-rules.md
  codex/
    skills/
      review.md
      test-plan.md
      release-note.md
  scripts/
    test.ps1
    lint.ps1
    format.ps1

`AGENTS.md` の推奨テンプレート

# What this repo does
- プロダクトの役割

# Read these first
- docs/01-product.md
- docs/02-architecture.md
- docs/04-review-rules.md

# Commands
- test: npm test
- lint: npm run lint
- format: npm run format

# Guardrails
- 変更理由を必ず要約
- PRには影響範囲を明記
- 依存追加時は理由を書く

# Multi-agent split
- implementer: 実装
- reviewer: 差分レビュー
- tester: テスト観点整理

Steps

Codex 構築はこの順で作ると安定します。

Codexは機能が広いので、設定より運用単位で作る方が失敗しません。先に surface、approval、documents、parallel roles を決めるのが正攻法です。

Step 1

surface を決める

まず CLI で始めるか、Codex app で並列タスク前提にするか決めます。小規模なら CLI、大量並列なら app が向きます。

Step 2

approval mode を固定する

初期は保守的に始める。古いCLI紹介でも Suggest / Auto Edit / Full Auto の差が重視されており、最初からフル自律は避けるべきです。

Step 3

`AGENTS.md` と docs を分離する

OpenAIの harness engineering では、巨大な instruction file より table of contents 型が推奨です。詳細は docs に逃がします。

Step 4

worktree 前提で役割分担する

実装、レビュー、テスト、調査の担当を分ける。Codex app も built-in worktree support を前面に出しています。

Step 5

繰り返す仕事を skill 化する

コード理解、eval、レビュー、ドキュメント更新などは毎回会話で説明せず、skill として残します。

Step 6

routine は automation に移す

issue triage、alert monitoring、CI/CD 補助のような定期仕事は、手動で安定してから automation に移すのが自然です。

Workflow

Codex は1体を鍛えるより、3役に分ける方が使いやすい。

OpenAI公式の multi-agent 強調と、X上の現場感を合わせると、Codex は監督型の使い方が一番ハマります。

Implementer

実装担当。feature、refactor、migration などを進める主エージェントです。

worktree を分ける
AGENTS.md と docs を読む
変更理由を要約する

Reviewer

差分レビュー担当。意図、依存、テスト不足、影響範囲を評価します。

PRレビューを自動化しやすい
skills と相性が良い
本番前の品質底上げに効く

Ops / Routine

issue triage、alert monitoring、docs 整理のような routine work 担当です。

automation 候補を見極める
Slack 連携や routine work と相性が良い
開発者の集中時間を守る

Latest Recommended Stack

2026年3月時点で、Codex に足す価値が高いもの

OpenAI公式とX上の実務運用を合わせると、Codex では Codex app、worktrees、skills、automations、Slack / GitHub 連携の5つが中核です。

Codex app + worktrees

最新のおすすめは app を使って複数 worktree を並列運用する構成です。OpenAI公式も built-in worktree support と parallel coding agents を前面に出しています。

Codex appworktreeparallel

main task
- implementer worktree
- reviewer worktree
- test-plan worktree

Skills

レビュー、test plan、release note、incident summary のような routine は skill 化するのが最新の定番です。OpenAI公式でも teams can check skills into their repositories と明記されています。

reviewtest-planrelease-note

codex/
  skills/
    review.md
    test-plan.md
    release-note.md

Automations

issue triage、alert monitoring、CI summary のような定期仕事は automation 化すると相性が良いです。Codex app の最新機能としても強く押されています。

issue triagealertsCI summary

おすすめ automation
- 毎朝: open issues を要約
- 毎時: alerts を監視
- PR 後: release note を生成

Slack / GitHub 連携

GA時点の公式メッセージでは Slack から @Codex で調査を委任し、GitHub code review へ戻す流れが推されています。Xでも「routine work を会話外に逃がす」用途で評価が高いです。

SlackGitHub reviewroutine work

Slack:
- @Codex で issue 調査

GitHub:
- reviewer skill で PR コメント草案
- human approves before merge

How To Configure

Codex はこの3層で設定すると分かりやすいです。

いまのおすすめは、AGENTS.md を目次にし、詳細を docs/、繰り返す仕事を skills/ や automations に分ける構成です。

`AGENTS.md`

何の repo か、何を読むか、主要コマンドだけを書く。

`docs/`

設計、レビュー基準、runbook を分けて置く。長文はここに逃がす。

`skills/` / app Automations

routine work を codify して、並列エージェントや定期実行へ渡す。

Mistakes

Codex 構築でやりがちな失敗

Claude Codeとは別の落とし穴があります。Codexは構造と役割を曖昧にすると強みが消えます。

`AGENTS.md` を百科事典にする

OpenAI公式は、巨大な instruction file がタスクや relevant docs を押し出すと説明しています。目次化が基本です。

parallel 前提なのに単独運用する

worktree や app を使わず、全部を1スレッドに押し込むと Codex の価値が半減します。

skill と automation を早く入れすぎる

routine が安定する前に自動化すると、間違った手順が固定化されます。まず手動で勝ち筋を作るべきです。

Sources

参照した X と OpenAI 公式

2026年3月8日時点で確認できた範囲です。Codex固有の構築論はXよりOpenAI公式の比重が高いため、公式ソースを主軸にしています。

X / Community

Codex 構築で参照した投稿

LangChainJP on X : Codex CLI の導入と approval modes
dominik kundel on X : Codex agent is open source / app-server interface
Aakash Gupta on X : agents need CLI, MCP, machine-readable docs
OpenAI Developers on X : code → design → code の surface 拡張
Or Hiltch on X : harness を自作しすぎない
OpenAI Developers on X : Slack、code review、routine work への委任

Official Docs

機能確認に使った OpenAI 公式

Next Action

Claude Code 側は、もっとミニマルです。

Codex が parallel-first なのに対して、Claude Code は minimal context-first の設計が効きます。

Claude Code 構築ページへ総合ガイドへ戻る