Briefing № 06·18 Z.ai（旧 Zhipu AI） GLM-5.2 · Open-Weights MoE / Post-Closed Era

クローズドの壁を、
オープンが砕く。

2026年6月、Z.ai が発表した GLM-5.2 は、MITライセンスのオープンウェイトでありながら、1Mトークンの長文脈と長時間継続（Long-horizon）タスクへの特化で、クローズド勢（GPT-5.5・Claude Opus 4.8）に匹敵——一部で凌駕する。コストは約6分の1。AIを「外部サービス」から、自社で運用する「資産」へと変える。

ベンチマークを見る → 主権AIとは →

1M tok

文脈ウィンドウ · 100万トークンの長文脈処理

~744B

総パラメータ · MoE（アクティブ約40B）

1/6cost

出力単価 · クローズド主要モデル比

MIT

ライセンス · 商用・改変・再配布が完全自由

GLM-5.2 の全体像 — オープンモデルの革命：性能・コスト・主権を一本に束ねる — **OVERVIEW** 圧倒的な性能と「長時間タスク」への特化、究極のオープン性と高い導入障壁の打破——GLM-5.2 が変える AI 開発の未来。 · GLM-5.2 Developer Blueprint

01 · Spec & Architecture

「巨大」ではなく、
効率で殴る。

GLM-5.2 は単なる「大きなモデル」ではない。総計約744B〜753B（アクティブ約40B）の MoE（混合専門家）構成に、1Mトークンの文脈ウィンドウ。鍵は、長文脈処理の計算負荷を劇的に削る新アーキテクチャ IndexShare だ。

開発元Z.ai（Zhipu AI）グローバルブランド

ライセンスMIT License商用・改変・再配布が完全自由

パラメータ~744B–753B / active 40BMoE（混合専門家）

文脈ウィンドウ1,000,000 tokens1M long-context

学習環境Huawei Ascend ×10万台MindSpore フレームワーク

思考モードThinking ModeHigh（高速・低消費）／ Max（深い推論）

仕組み · Mechanism

IndexShare

4層ごとに共有

隣接レイヤー間でトークンの選択結果（Top-k）が似る性質を利用し、4層ごとにインデクサを共有する。

→

効果 · Effect

FLOPs 削減

約2.9倍軽量化

1Mトークン処理時の計算量を約2.9倍削減。推論速度の向上とコスト低減を同時に実現する。

→

帰結 · Outcome

ローカル実行

手元で動く

軽量化が、巨大MoEを自社環境で動かす道を開く。クラウド依存からの脱却の前提に。

So What?

規模競争の土俵を、効率で降りた。 IndexShare と MoE により、GLM-5.2 は「パラメータを増やすほど重く高価になる」常識を回避した。1M文脈をローカルで——この一点が、後段のコストと主権の物語すべての前提になる。

02 · Engineering Benchmarks

クローズドの壁を、
エンジニアリングで破る。

ベンチマークは、GLM-5.2 が実務レベルのコーディングおよび自律型エージェントとして世界最高峰の知能を持つことを示す。特に長時間継続型のソフトウェア開発で、クローズドモデルに肉薄・凌駕する。

ベンチマーク GLM-5.2 対クローズド勢（GPT-5.5 / Opus 4.8）

SWE-bench Proバグ修正等の実務能力 62.1% GPT 凌駕GPT-5.5 58.6% を上回る。Opus 4.8 は 69.2%。

FrontierSWE長時間プロジェクトの完遂能力 74.4% 肉薄GPT-5.5 72.6% を上回り、Opus 4.8 75.1% に肉薄。

Terminal-Bench 2.1ターミナル操作・ツール使用の持続 81.0% 僅差GPT-5.5 84.0% / Opus 4.8 85.0% に対し僅差で追走。

Code Arena (Frontend)フロントエンド実装の総合評価 1,595 世界第2位オープンモデルでは圧倒的首位。Opus 4.7（Thinking）1,566 を上回る。

So What? · 長時間タスクへの特化

「数時間規模のデバッグを、目的を見失わず完遂する」 GLM-5.2 はリポジトリ全体の調査→計画→エラー解析→修正の反復を最後までやり切る。超難関 SWE-Marathon では依然 Opus 4.8 に一日の長があるが、一般的な実務リファクタリングでは同等の能力を発揮する。

03 · Economics

「性能のためにコストを払う」
時代の終わり。

GLM-5.2 の登場は、AIのコスト構造の常識を塗り替えた。100万トークンあたりの API コストで見ると、出力単価は GPT-5.5 の約6分の1。性能を落とさずに、運用コストを一桁変える。

モデル入力 / 出力（per 1M）備考

GLM-5.2オープンウェイト · MIT $1.40 / $4.40 最良比出力単価が GPT の約1/6。性能・コスト・自由度を統合。

GPT-5.5クローズド $5.00 / $30.00 高価高価な業界基準。出力が GLM-5.2 の約6.8倍。

Claude Opus 4.8クローズド · 高性能 $5.00 / $25.00 高コスト最高峰の性能だが、高性能・高コスト。

DeepSeek V4-Proオープン系 · 最安 $0.43 / $0.87 最安値価格は最安だが、長時間安定性で GLM に譲る。

So What? · 知能の単価が変わる

長時間稼働する自律エージェントを「多数」回せる。 出力コストが一桁下がると、これまで採算が合わなかった常時稼働のコーディングエージェント群が現実解になる。コスト最適化が必要なプロジェクトほど、GLM-5.2 の経済性が効く。

04 · Sovereign AI

No NVIDIA.
No American compute.

GLM-5.2 は、米国の輸出規制下において、中国国内のスタック（Huawei Ascend チップ＋ MindSpore）のみで学習された。NVIDIA を一切使わずフロンティア級モデルを成功させた事実は、特定ベンダーや政治的背景に依存しない「主権AI（Sovereign AI）」の現実味を世界に示した。

主権AI

Sovereign AI

ベンダーや政治的背景に依存しない AI を、自国・自社のスタックで構築できることを実証した。

供給網の多極化

Multipolar Compute

10万台規模の Huawei Ascend クラスタのみで学習。AIインフラの供給網が一極集中から動く。

データ主権

Open-Weights

オープンウェイトゆえ、機密情報を外部に送信せず、自社環境でモデルを完全にコントロールできる。

So What?

「主権AI」は理念ではなく、実装可能になった。 輸出規制という制約の下で、No NVIDIA のフロンティアモデルが成立した——これは、特定企業の規約・価格改定・地政学リスクに左右されない持続可能な AI インフラが、現実の選択肢になったことを意味する。

05 · Local Run & Integration

手元で動かし、
既存ツールに挿す。

MITライセンスのオープンウェイトゆえ、企業は機密を外部に送らず自社環境で運用できる。さらに OpenAI / Anthropic 互換のAPIエンドポイントを備え、既存の開発ワークフローへキーとURLの差し替えだけで統合できる。

ローカル実行

Unsloth Dynamic 2.0

2-bit 量子化（UD-IQ2_M）で約239GBまで圧縮。256GB ユニファイドメモリの Mac Studio 等で読み込み報告あり。

UD-IQ2_M · ~239GB

既存ツール統合

OpenAI / Anthropic 互換 API

キーとURLの差し替えのみで Cursor / Claude Code / Aider / Cline 等に即統合。ワークフローを変えずに移行できる。

drop-in / base_url 差替

運用上の注意

Caveat

重みだけでメモリの大半を占有する。1M の KV キャッシュをフル活用するには、マルチGPU 環境や API 利用が現実的。

KV cache @1M = heavy

推奨される
ユースケース。

GLM-5.2 が最も効くのは、機密性・コスト・独立性のいずれかが要件として強い現場だ。性能を犠牲にせずに、それらを同時に満たせる点が新しい。

逆に言えば、外部APIで十分な小規模・単発タスクでは、わざわざローカル運用の重量級スタックを抱える必要はない。「何を自分の資産として持つか」の判断が問われる。

適用シナリオ Use Cases

01高機密開発 — 外部APIに送れない金融・医療等、大規模システムのリファクタリング。
02コスト最適化 — 長時間稼働する自律コーディングエージェントを多数運用するプロジェクト。
03ロックイン回避 — 特定企業の規約・価格改定に左右されない、持続可能なAIインフラの構築。

So What?

AIを「消費する」段階から、「運用する資産」へ。 性能のために機密性とコストを犠牲にする時代は終わった。最高峰の知能を手元で完全にコントロールし、何を自動化するかが、これからの競争力を決定づける。

「性能・コスト・自由度」が、
実用レベルで統合された。
ポスト・クローズド時代の象徴。 GLM-5.2 Developer Blueprint — 2026·06·18

Same-Day Headlines

同日の、AI ヘッドライン。

GLM-5.2 の周辺で、生命科学・医療・資金調達・インフラの動きも加速した。2026年6月18日の主要トピックを俯瞰する。

LifeSciBench

OpenAI · AI Model

AIが現実の生命科学研究タスクをどう扱うかを評価する、専門家作成のベンチマーク。客観評価の基盤に。

openai.com / life-sci-bench

Google AMIE

Google AI · Nature 掲載

会話型AIが慢性疾患の管理で主治医と同等の性能を達成。AIの医療現場貢献の可能性を示唆。

blog.google / amie

Pramaana Labs $27M

Business · Khosla Ventures

AIの形式検証スタートアップがシード調達。法務・医薬・税務など高信頼領域を狙う。

techcrunch.com

日立 × OpenAI Codex

ITmedia · AI Model

Codex でレガシーシステムを解析・刷新。上流仕様の可視化と移行テストを効率化、サイバー防衛も視野。

itmedia.co.jp

Threads 5億 MAU

Meta · Product

月間アクティブが5億人に到達。フィード最適化「Dear Algo」を拡張した「Your Algo」を導入予定。

gigazine.net

MLPerf Training v6.0

MLCommons · AI Model

NVIDIA・AMD の AIサーバー学習性能を評価。AIモデル開発のハードウェア選定の参考指標に。

gigazine.net / mlperf

So What?

「評価」と「検証」が、同時にテーマ化した一日だった。 LifeSciBench・AMIE・MLPerf・形式検証——GLM-5.2 のベンチマーク話と響き合うように、AIをどう測り、どう信頼するかが業界全体の焦点になっている。

From the Briefing Deck

GLM-5.2 の全貌、原典より。

本スライドの元になった Developer Blueprint（全15ページ）の主要図版。スペック・ベンチマーク・経済性・主権・実装の論点を、原典のビジュアルで俯瞰する。

オープンモデルの革命 — GLM-5.2 が変える AI 開発の総括 — **Cover** 「オープンモデルの革命」——性能・コスト・主権を束ねる GLM-5.2 の総括。

主要指標 — MIT / 1M Context / SWE-bench Pro 62.1% / コスト1/6 — **Key Stats** MIT で完全オープン × 1M 文脈 × SWE-bench Pro 62.1% × コスト約1/6。

ベンチマーク性能分析 — クローズド勢との比較 — **Benchmarks** SWE-bench Pro / FrontierSWE / Terminal-Bench / Code Arena の性能分析。

IndexShare アーキテクチャ — 長文脈処理の計算負荷削減 — **IndexShare** 4層ごとのインデクサ共有で 1M 処理時 FLOPs 約2.9倍削減。

コスト構造の分析 — 入出力単価と総保有コスト — **Economics** 入出力単価とTCO——出力単価が GPT-5.5 の約1/6 になる経済性。

The Reality — Dynamic Quantization 2.0 によるローカル実行 — **Local Run** Unsloth Dynamic 2.0 量子化で、巨大MoEのローカル実行が現実解に。

Ecosystem Integration — 既存ツールへの即時統合 — **Integration** OpenAI/Anthropic 互換 API で Cursor / Claude Code 等へ即統合。

企業価値の創出 — Business Use Cases — **Use Cases** 高機密開発・コスト最適化・ロックイン回避という適用シナリオ。

マルチモデル・オーケストレーション時代 — 実用性への転換 — **Takeaway** 「最高性能の追求」から「最高の実用性」へ——ポスト・クローズドの結論。

Sources / References

出典と関連リファレンス。

本スライドは Z.ai による GLM-5.2 の公開情報と Developer Blueprint に基づく解説。ベンチマーク・コスト・量子化仕様は各一次ソースでの裏取りを推奨する。

01 Z.ai — GLM-5.2 公式ブログ（Hugging Face）モデル仕様・ベンチマーク・ライセンス（MIT）の一次情報。オープンウェイトの配布元。 → 02 Z.ai（旧 Zhipu AI）開発元の公式サイト。GLM シリーズと API（OpenAI/Anthropic 互換）の窓口。 → 03 OpenAI — LifeSciBench同日発表の生命科学評価ベンチマーク。AIの評価・検証というテーマの一次ソース。 → 04 Google Research — AMIE（Nature）会話型AIが慢性疾患管理で主治医と同等の性能を達成した研究の一次情報。 → 05 関連 · 06·17 SpaceX × Cursor「AI開発の垂直統合」クローズド勢の「垂直統合」戦略——オープンウェイトの対極にある前日の論点。 →

クローズドの壁を、オープンが砕く。

「巨大」ではなく、効率で殴る。

IndexShare

FLOPs 削減

ローカル実行

クローズドの壁を、エンジニアリングで破る。

「性能のためにコストを払う」時代の終わり。

No NVIDIA.No American compute.

主権AI

供給網の多極化

データ主権

手元で動かし、既存ツールに挿す。

ローカル実行

既存ツール統合

運用上の注意

推奨されるユースケース。

同日の、AI ヘッドライン。

LifeSciBench

Google AMIE

Pramaana Labs $27M

日立 × OpenAI Codex

Threads 5億 MAU

MLPerf Training v6.0

GLM-5.2 の全貌、原典より。

出典と関連リファレンス。

クローズドの壁を、
オープンが砕く。

「巨大」ではなく、
効率で殴る。

クローズドの壁を、
エンジニアリングで破る。

「性能のためにコストを払う」
時代の終わり。

No NVIDIA.
No American compute.

手元で動かし、
既存ツールに挿す。

推奨される
ユースケース。