百科事典ではなく、どの docs を読むべきかを示す目次として使う。
Codex は、指示ファイルより harness を設計する。
X上でCodexまわりに共有されている実践とOpenAI公式を合わせると、Codex構築の本質は
「長い AGENTS.md を書くこと」ではなく、並列実行、分業、技能化、監督しやすい harness を作ることにあります。
つまり Claude Code よりも、マルチエージェント前提の運用設計が主役です。
並列エージェントを回すなら、最初から worktree と分業ルールを考える。
繰り返す作業は個別の skill にし、PRごとに毎回長文で説明しない。
Codex は1体を細かく操るより、複数体を監督する設計が合う。
Codex 構築の答えは、単独ツール最適化ではなく agent-first です。
OpenAI公式は multi-agent workflows、skills、automations、worktrees を強く押しています。X上でもCodexは「1回で完璧に書かせる道具」ではなく「複数の並列タスクをさばく指揮所」として語られています。
1. 入口は CLI か App
npm i -g @openai/codex で CLI、あるいは Codex app で始める。並列タスク運用なら app の価値が高いです。
2. AGENTS.md は目次化する
重要 docs、コマンド、ルールへの入口だけ書く。詳細は docs に分ける。OpenAI公式の harness engineering と一致します。
3. 並列役割を先に決める
実装、レビュー、テスト生成、調査などの役割分担を決めると、worktree と skills が生きます。
4. routine は skill 化する
レビュー、docs 更新、incident summary など、繰り返す仕事は skill に落とした方が Codex の運用品質が上がります。
Codex の推奨最小構成
Codexは単独プロンプトより、リポジトリ構造と並列作業のしやすさで差が出ます。
ファイル構成
repo/
AGENTS.md
docs/
01-product.md
02-architecture.md
03-commands.md
04-review-rules.md
codex/
skills/
review.md
test-plan.md
release-note.md
scripts/
test.ps1
lint.ps1
format.ps1
AGENTS.md の推奨テンプレート
# What this repo does
- プロダクトの役割
# Read these first
- docs/01-product.md
- docs/02-architecture.md
- docs/04-review-rules.md
# Commands
- test: npm test
- lint: npm run lint
- format: npm run format
# Guardrails
- 変更理由を必ず要約
- PRには影響範囲を明記
- 依存追加時は理由を書く
# Multi-agent split
- implementer: 実装
- reviewer: 差分レビュー
- tester: テスト観点整理
Codex 構築はこの順で作ると安定します。
Codexは機能が広いので、設定より運用単位で作る方が失敗しません。先に surface、approval、documents、parallel roles を決めるのが正攻法です。
surface を決める
まず CLI で始めるか、Codex app で並列タスク前提にするか決めます。小規模なら CLI、大量並列なら app が向きます。
approval mode を固定する
初期は保守的に始める。古いCLI紹介でも Suggest / Auto Edit / Full Auto の差が重視されており、最初からフル自律は避けるべきです。
AGENTS.md と docs を分離する
OpenAIの harness engineering では、巨大な instruction file より table of contents 型が推奨です。詳細は docs に逃がします。
worktree 前提で役割分担する
実装、レビュー、テスト、調査の担当を分ける。Codex app も built-in worktree support を前面に出しています。
繰り返す仕事を skill 化する
コード理解、eval、レビュー、ドキュメント更新などは毎回会話で説明せず、skill として残します。
routine は automation に移す
issue triage、alert monitoring、CI/CD 補助のような定期仕事は、手動で安定してから automation に移すのが自然です。
Codex は1体を鍛えるより、3役に分ける方が使いやすい。
OpenAI公式の multi-agent 強調と、X上の現場感を合わせると、Codex は監督型の使い方が一番ハマります。
Implementer
実装担当。feature、refactor、migration などを進める主エージェントです。
- worktree を分ける
- AGENTS.md と docs を読む
- 変更理由を要約する
Reviewer
差分レビュー担当。意図、依存、テスト不足、影響範囲を評価します。
- PRレビューを自動化しやすい
- skills と相性が良い
- 本番前の品質底上げに効く
Ops / Routine
issue triage、alert monitoring、docs 整理のような routine work 担当です。
- automation 候補を見極める
- Slack 連携や routine work と相性が良い
- 開発者の集中時間を守る
2026年3月時点で、Codex に足す価値が高いもの
OpenAI公式とX上の実務運用を合わせると、Codex では Codex app、worktrees、skills、automations、Slack / GitHub 連携の5つが中核です。
Codex app + worktrees
最新のおすすめは app を使って複数 worktree を並列運用する構成です。OpenAI公式も built-in worktree support と parallel coding agents を前面に出しています。
main task
- implementer worktree
- reviewer worktree
- test-plan worktree
Skills
レビュー、test plan、release note、incident summary のような routine は skill 化するのが最新の定番です。OpenAI公式でも teams can check skills into their repositories と明記されています。
codex/
skills/
review.md
test-plan.md
release-note.md
Automations
issue triage、alert monitoring、CI summary のような定期仕事は automation 化すると相性が良いです。Codex app の最新機能としても強く押されています。
おすすめ automation
- 毎朝: open issues を要約
- 毎時: alerts を監視
- PR 後: release note を生成
Slack / GitHub 連携
GA時点の公式メッセージでは Slack から @Codex で調査を委任し、GitHub code review へ戻す流れが推されています。Xでも「routine work を会話外に逃がす」用途で評価が高いです。
Slack:
- @Codex で issue 調査
GitHub:
- reviewer skill で PR コメント草案
- human approves before merge
Codex はこの3層で設定すると分かりやすいです。
いまのおすすめは、AGENTS.md を目次にし、詳細を docs/、繰り返す仕事を skills/ や automations に分ける構成です。
AGENTS.md
何の repo か、何を読むか、主要コマンドだけを書く。
docs/
設計、レビュー基準、runbook を分けて置く。長文はここに逃がす。
skills/ / app Automations
routine work を codify して、並列エージェントや定期実行へ渡す。
Codex 構築でやりがちな失敗
Claude Codeとは別の落とし穴があります。Codexは構造と役割を曖昧にすると強みが消えます。
AGENTS.md を百科事典にする
OpenAI公式は、巨大な instruction file がタスクや relevant docs を押し出すと説明しています。目次化が基本です。
parallel 前提なのに単独運用する
worktree や app を使わず、全部を1スレッドに押し込むと Codex の価値が半減します。
skill と automation を早く入れすぎる
routine が安定する前に自動化すると、間違った手順が固定化されます。まず手動で勝ち筋を作るべきです。
参照した X と OpenAI 公式
2026年3月8日時点で確認できた範囲です。Codex固有の構築論はXよりOpenAI公式の比重が高いため、公式ソースを主軸にしています。
Codex 構築で参照した投稿
- LangChainJP on X : Codex CLI の導入と approval modes
- dominik kundel on X : Codex agent is open source / app-server interface
- Aakash Gupta on X : agents need CLI, MCP, machine-readable docs
- OpenAI Developers on X : code → design → code の surface 拡張
- Or Hiltch on X : harness を自作しすぎない
- OpenAI Developers on X : Slack、code review、routine work への委任
機能確認に使った OpenAI 公式
Claude Code 側は、もっとミニマルです。
Codex が parallel-first なのに対して、Claude Code は minimal context-first の設計が効きます。