Anthropic (ANTH.PVT) a lancé Claude Sonnet 5, un nouveau modèle de langage de grande taille conçu autour des charges de travail IA agentique, et le positionnement est explicitement économique: qualité de raisonnement comparable aux modèles haut de gamme de l'entreprise à une fraction du coût en tokens. Ce positionnement importe en ce moment car plusieurs des plus grands acheteurs d'IA, dont Meta (META), Amazon (AMZN) et Uber (UBER), ont consacré les derniers mois à resserrer les contrôles sur la consommation de tokens après avoir découvert à quel point l'utilisation de modèles sans restriction était devenue coûteuse.
En Résumé
- Modèle: Claude Sonnet 5, successeur de Sonnet 4.6
- Positionnement: en dessous de Claude Fable 5 et Mythos 5 en capacité brute, mais décrit par Anthropic comme proche d'Opus 4.8 en performance
- Focus: complétude de tâches autonomes et agentiques à moindre coût en tokens
- Sécurité: protections de cybersécurité portées depuis Opus 4.7 et 4.8, malgré l'absence de formation dédiée à la cybersécurité
- Contexte: le lancement intervient alors qu'Anthropic se prépare pour une introduction en bourse, ayant déposé confidentiellement auprès de la SEC le 1er juin

Quoi de Nouveau dans Sonnet 5
Anthropic présente Sonnet 5 comme un bond en avant par rapport à Sonnet 4.6 spécifiquement en fiabilité agentique, c'est à dire la capacité du modèle à mener une tâche multitâche jusqu'à son terme sans intervention humaine. Selon l'entreprise, les testeurs ont constaté que Sonnet 5 complète les affectations complexes où les générations Sonnet antérieures s'arrêteraient à mi-parcours, et qu'il vérifie automatiquement les résultats sans être explicitement invité à le faire. Ce type de comportement de vérification non sollicité est remarquable pour un modèle agentique, car un mode d'échec persistant dans les systèmes IA autonomes a été la propagation d'erreur silencieuse, où un modèle procède avec assurance sur une étape intermédiaire défectueuse.
Anthropic prend soin de classer Sonnet 5 en dessous de ses modèles Fable 5 et Mythos 5 en capacité absolue. Mais l'entreprise affirme qu'il se situe près d'Opus 4.8 en performance pratique, ce qui est une affirmation significative étant donné qu'Opus a fonctionné comme le niveau de raisonnement phare d'Anthropic. Si cet écart s'est véritablement réduit, cela change le calcul pour les développeurs qui ont opté par défaut pour les modèles de classe Opus pour les pipelines agentiques purement parce que les modèles de classe Sonnet ne pouvaient pas fermer de manière fiable les chaînes de tâches plus longues.
L'Économie des Tokens Derrière le Lancement
Le contexte plus large ici est une correction par rapport à ce que l'industrie a commencé à appeler



