Premiera: 28 maja 2026 · Model API: claude-opus-4-8
28 maja 2026 roku Anthropic wprowadził Claude Opus 4.8 – najnowszą wersję swojego modelu z serii Opus. Model jest bezpośrednim ulepszeniem względem Opus 4.7, oferuje poprawę wyników w benchmarkach i jest dostępny od pierwszego dnia w tej samej cenie co poprzednik. Sama Anthropic określa go jako „skromne, ale wymierne ulepszenie”.
Główne obszary poprawy to kodowanie agentyczne, rozumowanie wielodyscyplinarne, praca profesjonalna oraz agentyczna analiza finansowa.
Najważniejsze zmiany
- Uczciwość (honesty). Opus 4.8 częściej sygnalizuje własną niepewność i rzadziej formułuje nieuzasadnione twierdzenia. Według wewnętrznych ewaluacji Anthropic jest około cztery razy mniej skłonny niż poprzednik do przepuszczania niezauważonych błędów we własnym kodzie.
- Lepsze dopasowanie (alignment). Zespół ds. alignmentu uznał, że model osiąga nowe maksima w cechach prospołecznych – wspieraniu autonomii użytkownika i działaniu w jego najlepszym interesie. Wskaźniki zachowań niepożądanych są istotnie niższe niż w Opus 4.7.
Nowe funkcje uruchomione tego samego dnia
- Dynamic workflows. Funkcja w wersji research preview pozwala Claude na realizację bardzo dużych zadań w Claude Code: model planuje pracę, uruchamia setki równoległych subagentów w jednej sesji, a następnie weryfikuje wyniki przed przekazaniem ich użytkownikowi. Dostępna w planach Enterprise, Team i Max.
- Effort control. Nowy element obok selektora modelu w claude.ai i Cowork pozwala wybrać, ile „wysiłku” Claude wkłada w odpowiedź. Wyższe ustawienia oznaczają głębsze myślenie i lepsze odpowiedzi, niższe – szybsze działanie. Funkcja dostępna we wszystkich planach.
- Fast mode. Tryb, w którym model pracuje 2,5× szybciej, jest teraz trzy razy tańszy niż w poprzednich modelach.
- Aktualizacja Messages API. API przyjmuje teraz wpisy systemowe wewnątrz tablicy messages, co pozwala aktualizować instrukcje modelu w trakcie zadania bez przerywania prompt cache.
Wybrane wyniki benchmarków
Dane pochodzą z Claude Opus 4.8 System Card (porównanie Opus 4.8 vs Opus 4.7):
| Benchmark | Opus 4.8 | Opus 4.7 |
|---|---|---|
| SWE-bench Pro | 69,2% | 64,3% |
| SWE-bench Verified | 88,6% | 87,6% |
| Terminal-Bench 2.1 | 74,6% | 66,1% |
| Humanity's Last Exam (bez narzędzi) | 49,8% | — |
| Humanity's Last Exam (z narzędziami) | 57,9% | — |
Według testerów partnerskich Opus 4.8 uzyskał 84% na Online-Mind2Web (skok względem Opus 4.7 i GPT-5.5) oraz jako pierwszy model przekroczył próg 10% na Legal Agent Benchmark w standardzie all-pass.
Dostępność i ceny
Claude Opus 4.8 jest dostępny od dnia premiery. Ceny zwykłego użycia są niezmienione względem Opus 4.7: 5 USD za milion tokenów wejściowych i 25 USD za milion tokenów wyjściowych. Fast mode kosztuje 10 USD / 50 USD za milion tokenów. Deweloperzy korzystają z modelu przez Claude API jako claude-opus-4-8.
Co dalej
Anthropic pracuje nad modelami o zbliżonych do Opus możliwościach przy niższym koszcie oraz nad nową klasą modeli o jeszcze wyższej inteligencji. W ramach Project Glasswing wąska grupa organizacji korzysta już z Claude Mythos Preview do prac nad cyberbezpieczeństwem; modele klasy Mythos mają trafić do wszystkich klientów „w nadchodzących tygodniach”.