Anthropic (ANTH.PVT) ha rilasciato Claude Sonnet 5, un nuovo modello linguistico di grandi dimensioni costruito attorno ai carichi di lavoro agentic AI, e il messaggio è esplicitamente economico: qualità di ragionamento comparabile ai modelli di fascia alta dell'azienda a una frazione del costo dei token. Questo posizionamento è rilevante in questo momento perché diversi tra i maggiori acquirenti di AI, inclusi Meta (META), Amazon (AMZN) e Uber (UBER), hanno passato i recenti mesi irrigidendo i controlli sul consumo di token dopo aver scoperto quanto fosse diventato costoso l'utilizzo incontrollato dei modelli.
In Sintesi
- Modello: Claude Sonnet 5, successore di Sonnet 4.6
- Posizionamento: al di sotto di Claude Fable 5 e Mythos 5 in termini di capacità grezza, ma descritto da Anthropic come vicino a Opus 4.8 per prestazioni
- Obiettivo: completamento di attività agentic e autonome a costo di token inferiore
- Sicurezza: misure di cybersicurezza trasferite da Opus 4.7 e 4.8, nonostante nessun addestramento dedicato alla cybersicurezza
- Contesto: il lancio arriva mentre Anthropic si prepara per un IPO, avendo depositato in via confidenziale presso la SEC il 1 giugno

Cosa C'è di Veramente Nuovo in Sonnet 5
Anthropic presenta Sonnet 5 come un salto rispetto a Sonnet 4.6 specificamente nell'affidabilità agentic, cioè nella capacità del modello di portare a termine un'attività multistep senza intervento umano. Secondo l'azienda, i tester hanno riscontrato che Sonnet 5 completa i compiti complessi dove le generazioni precedenti di Sonnet si fermerebbero a metà strada, e che controlla autonomamente l'output senza essere esplicitamente sollecitato a farlo. Questo tipo di comportamento di verifica spontanea è notevole per un modello agentic, poiché una modalità di errore persistente nei sistemi di AI autonoma è stata la propagazione silenziosità degli errori, dove un modello procede con sicurezza su un passaggio intermedio difettoso.
Anthropic è attenta nel posizionare Sonnet 5 al di sotto dei suoi modelli Fable 5 e Mythos 5 in termini di capacità assoluta. Ma l'azienda afferma che si colloca vicino a Opus 4.8 in termini di prestazioni pratiche, il che è un'affermazione significativa dato che Opus ha funzionato come livello di ragionamento di punta di Anthropic. Se questo divario si è genuinamente ridotto, cambia il calcolo per gli sviluppatori che sono stati portati a utilizzare modelli di classe Opus per pipeline agentic semplicemente perché i modelli di livello Sonnet non potevano affidabilmente completare catene di attività più lunghe.
L'Economia dei Token Dietro il Lancio
Lo sfondo più ampio qui è una correzione rispetto a quella che l'industria ha iniziato a chiamare



