目玉の新機能「Computer Use」
macOS FIRST🎯 Codexが独立カーソルを持ち、画面を「見て」「クリックする」
Computer Useは、Codexが独立したカーソルと視覚認識(スクリーンショット)を持って、ユーザーの作業を邪魔せずバックグラウンドでGUIを操作する機能です。iOSシミュレーター、管理画面、Adobe Lightroom、Excelなど非APIアプリも人間のようにクリック操作可能。フロントエンドの視覚的バグを見つけて修正し、再確認するループを完全自動化します。
デスクトップアプリの新機能(Mac / Windows)
NEWIn-app Browser
アプリ内ブラウザを搭載。localhostのフロントエンドを開いて画面上に直接修正指示(「この余白を8px広げて」等)が可能。AIが修正→再確認までループ。
gpt-image-1.5 統合
スクリーンショットとコードからUIモックアップを即時生成。Photoshopで生成画像を背景にしてサムネイル作成等、GUI連携が可能。
Memory
過去の好み・プロジェクト設定を永続的に記憶。セッションをまたいで学習。Enterprise/Edu/EEA向けは順次展開中。
Automations
数日〜数週間にわたる長期タスクをスケジュール起動。夜間バッチ・毎朝のレポート生成・CI連携を自律実行。
SSH Remote Devbox
SSH経由でリモート開発環境に接続し、複数ターミナルを同時操作。ログ確認・デプロイを横断実行。
MCPプラグイン 90+
Jira / GitLab Issues / CircleCI / Atlassian Rovo / MS Suite / Notion / Renderなど90種以上のMCPサーバーと深連携。
⚠️ Windows版Computer Useは数週間〜1ヶ月遅れの見込み
- Win32 APIの難易度が高く、macOSから遅れて提供予定
- 現時点の代替として
Playwright MCPやPyAutoGUIでのプロトタイプ運用を推奨 - Windows版のCodexデスクトップアプリ自体は利用可能(Computer Use以外の機能)
並列実行:Subagentsと max_threads=6
max_threads
並列スレッド数。config.tomlで調整可能
max_depth
再帰深さ。多段階タスクで増やす
.codex/agents/
プロジェクト別にエージェント定義
sandbox_mode
権限レベルを細かく制御
(max_threads default)
(直列比)
/ 成功率
開発者
搭載モデル — 使い分けで速度と精度を両立
gpt-5.4
処理のベースとなる主力モデル。「賢いが遅い」特性。複雑な設計判断・コードレビューに最適。
gpt-5.4-mini
軽量版。Subagentsで並列実行する際のデフォルト推奨。速度とコストのバランス◎
gpt-5.3-codex-spark
「速いが賢くない」Sparkモデル。リアルタイム補完・短いタスクに。カスタムTOMLで指定可。
gpt-image-1.5
UIモックアップ生成・画像編集に統合。Photoshop・Lightroomとの連携でGUIデザインも自動化。
GPT-Rosalind
生物/創薬ドメイン特化モデルをCodex経由で利用可能。研究開発ユースケース向け。
Realtime Voice V2
Codex CLI v0.119.0 / v0.120.0(4/10-11)でリアルタイム音声機能を強化。
Slack / GitHub 統合 — @ComputerUse で完結
未読横断・ToDo抽出
@ComputerUseで未読チャンネル確認、今日のToDoをリマインダー設定、仕様議論を抽出してObsidianにZettelkastenノート作成、Notionプロジェクトページ更新まで自動化。
PR完全自動化
GitHub PRを読み込んでレビューコメント指摘を解決、テスト・Lint・ビルドまで一貫実行。Obsidian Vault→GitHub push→mainマージ/PR起票も可能。
90+ MCP プラグイン
Jira / GitLab Issues / CircleCI / Atlassian Rovo / Microsoft Suite / Notion / Render。既存のエンタープライズツールに「AIが視覚的に」接続。
Claude Code vs Codex — 置き換えでなく「タッグ運用」
⌨️ Claude Code(CLI)
- APIファースト・コード直書き
- ターミナル内で完結する高速実装
- プロトタイプ・計画フェーズが爆速
- 細かい実装・微調整に最適
- デザイン→コード(Claude Design)が強力
🖱️ Codex Desktop(GUI)
- GUI視覚操作(Computer Use)に特化
- 非APIアプリもクリック操作で自動化
- 並列Subagentsで長期運用
- GUI検証・テスト・外部ツール連携が得意
- macOS先行、Windows近日対応
実際のユースケース
フロントエンド視覚フィードバック開発
In-app Browserでlocalhost:3000を開き、「この余白を8px広げて」「この色をもう少し明るく」と指示。AIが修正&再確認ループをGUIで完結。
非APIアプリ・GUIテスト自動化
iOSシミュレーター、管理画面、Adobe Lightroom、Excelを人間のようにクリック操作。API未提供のアプリでも作業・テストを自動化。
レガシーコード一括修正
数万行のコードベースを横断してTypeScript化やLint修正。Subagentsを並列実行し、サンドボックスで安全に。
Slack未読 → ToDo自動化
@ComputerUseで未読確認→今日のToDoをリマインダー設定→仕様議論をObsidianに保存→Notionプロジェクトページ更新まで一気通貫。
🏢 Cisco 導入事例 — レビュー時間50%削減
Ciscoなどの大企業導入事例では、レビュー時間を50%削減し、従来「数週間」かかっていた開発期間を「数日」に短縮した成果が証明されています。
セキュリティ・サンドボックス・承認モード
🔐 macOS権限と承認フロー
- 初回セットアップ:システム設定で「画面収録(Screen Recording)」と「アクセシビリティ(Accessibility)」の権限付与が必須
- アプリ別承認:初回タスク実行時に各アプリごとに「Always Allow」確認が表示される
- 禁止事項:ターミナル自身やCodexアプリ自体の操作はセキュリティ上禁止
- sudo系操作は不可:管理者権限が必要な操作はCodexから実行不可
- 機密ファイル対策:環境変数(
.env)などはユーザーが見守るか、.gitignoreでコミット禁止にする運用が必須
・
read-only — 探索・ログ解析向け(推奨デフォルト)・
write — ファイル編集可、コマンド実行は承認制・
full — 長時間Autoモード向け、事前承認で広範な操作を許可
提供時期・対応地域
・ 発表:2026年4月16日「Codex for (almost) everything」アップデート
・ ロールアウト:ChatGPTサインイン済みのデスクトップアプリユーザーへ即日順次展開
・ 対応地域:EU/UK/スイス(EEA)を除く地域で利用可能、日本でも即時利用可
・ 関連CLI:Codex CLI v0.119.0(4/10)、v0.120.0(4/11)でRealtime Voice V2強化
・ Memory機能:Enterprise / Edu / EEA向けは近日提供予定
.codex/agents/*.toml(Subagent定義)デスクトップ全体を操作する『作業OS』だ」
本日のまとめ
Computer Use
macOS先行、独立カーソルでGUI視覚操作
Subagents並列
max_threads=6、速度3-5倍、PRレビュー95%成功
MCP 90+ 連携
Slack / Jira / Notion / GitHub / Render 等
Cisco実績
レビュー50%減、開発期間 週→日 に短縮