🏠 TOPに戻る
2025年9月12日 Google Research発表

🔒VaultGemma

世界初の差分プライバシー対応大規模言語モデル

⚙️技術仕様

1B
パラメータ
26
1024
コンテキスト長

アーキテクチャ: デコーダ専用Transformer、GeGLU活性化、RMSNorm、Multi-Query Attention

訓練環境: TPU v6e × 2048枚で100kステップ

🛡️プライバシー保証

ε ≤ 2.0, δ ≤ 1.1×10⁻¹⁰
1024トークン単位での厳格な差分プライバシー
  • 訓練データの記憶を完全防止
  • DP-SGD + Poissonサンプリング
  • 50トークン再現テストで記憶検出なし

📊性能評価

  • 最新SOTA(Llama 3.1、Gemini)より低性能
  • 非DPのGemma3 1Bより低スコア
  • 5年前の非DPモデルと同等性能
  • 実務上十分な精度を提供

⚖️「プライバシー税」による性能低下は避けられないが、機密データ処理では安全性を優先

🏥想定用途

医療
金融
法務
研究
  • 電子カルテの安全な要約・QA
  • 取引記録のプライベート分析
  • 契約書の機密文書生成
  • オンプレミスでの規制要件対応

🌟歴史的意義

VaultGemmaは差分プライバシーをモデル設計の中心に据えた初の1B規模LLMとして、 「プライバシー・バイ・デザイン」を実現。 機密データを扱う産業へのAI導入を大きく前進させました。