Anthropic (ANTH.PVT)が新型大言語モデル「Claude Sonnet 5」をリリースしました。このモデルはエージェント型AI業務を中心に設計されており、その訴求点は明確に経済性です。同社の最上位モデルに匹敵する推論品質をトークンコストの大幅削減で実現します。この立ち位置が重要な理由は、Meta (META)、Amazon (AMZN)、Uber (UBER)といった大手AI利用企業が最近になってトークン消費の統制を強化しているからです。無制限のモデル使用がいかに高コストかを発見した後の動きです。
概要
- モデル:Claude Sonnet 5、Sonnet 4.6の後継
- ポジション:純粋な機能ではClaude Fable 5およびMythos 5を下回るが、AnthropicはパフォーマンスではOpus 4.8に近いと説明
- 焦点:低トークンコストでのエージェント型、自律型タスク完了
- セキュリティ:Opus 4.7および4.8から移植されたサイバーセキュリティ対策を搭載、ただし専門的なサイバーセキュリティ学習なし
- 背景:Anthropicが6月1日にSECに秘密裏に届け出を行い、IPO準備を進める中でのローンチ

Sonnet 5の実際の新機能
AnthropicはSonnet 5をSonnet 4.6との比較で、エージェント型の信頼性において飛躍的に進歩したモデルとして位置付けています。これは複数ステップのタスクを人間の介入なしで完了させるモデルの能力を意味します。同社によると、テスターがSonnet 5を試した結果、以前のSonnetは途中で停止していた複雑な作業を完了でき、明示的なプロンプトなしに自動的に出力を検証することがわかったとのことです。このような自発的な検証動作はエージェント型モデルにとって特筆すべき点です。自律型AIシステムの持続的な失敗モード として、モデルが不正な中間ステップで自信を持って処理を進める「静かなエラー伝播」があるからです。
AnthropicはSonnet 5を絶対的な機能ではFable 5およびMythos 5より下に位置付けることに慎重です。しかし同社はSonnet 5がOpus 4.8の実用的なパフォーマンスに近いと述べており、これはOpusがAnthropicの旗艦推論層として機能してきたことを考えると重要な主張です。このギャップが真に狭まったのであれば、エージェント型パイプラインのためにSonnetクラスのモデルが長期のタスクチェーンを確実に完了できなかったという理由だけでOpusクラスモデルをデフォルトにしていた開発者の計算に変化をもたらします。
このローンチの背景にあるトークン経済学
より広い背景は、業界が呼び始めた



