Anthropic (ANTH.PVT) wypuścił Claude Sonnet 5, nowy duży model języka stworzony dla zadań agentic AI, a propozycja jest wyraźnie ekonomiczna: porównywalna jakość rozumowania do modeli najwyższej klasy firmy przy ułamku kosztu tokenów. To pozycjonowanie ma znaczenie teraz, ponieważ kilku największych nabywców AI, w tym Meta (META), Amazon (AMZN) i Uber (UBER), spędziło ostatnie miesiące na zaostrzeniu kontroli nad konsumpcją tokenów po odkryciu, jak kosztowne stało się nieograniczone użytkowanie modeli.
W Skrócie
- Model: Claude Sonnet 5, następca Sonnet 4.6
- Pozycjonowanie: poniżej Claude Fable 5 i Mythos 5 w surowych możliwościach, ale opisany przez Anthropic jako zbliżony do Opus 4.8 w wydajności
- Fokus: autonomiczne wykonanie zadań przy niższym koszcie tokenów
- Bezpieczeństwo: zabezpieczenia cyberbezpieczeństwa przeniesione z Opus 4.7 i 4.8, pomimo braku dedykowanego treningu cyberbezpieczeństwa
- Kontekst: premiera odbywa się, gdy Anthropic przygotowuje się do IPO, mając poufnie złożony wniosek w SEC 1 czerwca

Co Nowego w Sonnet 5
Anthropic przedstawia Sonnet 5 jako skok w stosunku do Sonnet 4.6 konkretnie w niezawodności agentic, co oznacza zdolność modelu do przeprowadzenia wieloetapowego zadania do końca bez interwencji człowieka. Według firmy testerzy stwierdzili, że Sonnet 5 kończy złożone zlecenia, w których wcześniejsze generacje Sonnet zatrzymywałyby się w połowie, i że sam sprawdza wyniki bez wyraźnego na to polecenia. Ten rodzaj niezapytanej weryfikacji jest godny uwagi dla modelu agentic, ponieważ trwałym trybem awarii w autonomicznych systemach AI była dyskretna propagacja błędów, gdzie model pewnie kontynuuje na podstawie błędnego kroku pośredniego.
Anthropic ostrożnie uszeregowuje Sonnet 5 poniżej swoich modeli Fable 5 i Mythos 5 w zdolności bezwzględnej. Jednak firma mówi, że ląduje blisko Opus 4.8 w praktycznej wydajności, co jest ważnym roszczeniem biorąc pod uwagę, że Opus funkcjonował jako tier do rozumowania Anthropic. Jeśli ta luka naprawdę się zmniejszyła, zmienia to rachunek dla programistów, którzy domyślnie sięgali po modele klasy Opus dla potoków agentic wyłącznie dlatego, że modele warstwy Sonnet nie mogły niezawodnie zamknąć dłuższych łańcuchów zadań.
Ekonomika Tokenów Za Premierą
Szerszy kontekst to korekta wobec tego, co branża zaczęła nazywać



