Porady. Pandas. Python. Django. Microsoft Power BI. Tableau.

Claude Opus 4.8 - nowy flagowy model Anthropic

Premiera: 28 maja 2026 · Model API: claude-opus-4-8

28 maja 2026 roku Anthropic wprowadził Claude Opus 4.8 – najnowszą wersję swojego modelu z serii Opus. Model jest bezpośrednim ulepszeniem względem Opus 4.7, oferuje poprawę wyników w benchmarkach i jest dostępny od pierwszego dnia w tej samej cenie co poprzednik. Sama Anthropic określa go jako „skromne, ale wymierne ulepszenie”.

Główne obszary poprawy to kodowanie agentyczne, rozumowanie wielodyscyplinarne, praca profesjonalna oraz agentyczna analiza finansowa.

Najważniejsze zmiany

  • Uczciwość (honesty). Opus 4.8 częściej sygnalizuje własną niepewność i rzadziej formułuje nieuzasadnione twierdzenia. Według wewnętrznych ewaluacji Anthropic jest około cztery razy mniej skłonny niż poprzednik do przepuszczania niezauważonych błędów we własnym kodzie.
  • Lepsze dopasowanie (alignment). Zespół ds. alignmentu uznał, że model osiąga nowe maksima w cechach prospołecznych – wspieraniu autonomii użytkownika i działaniu w jego najlepszym interesie. Wskaźniki zachowań niepożądanych są istotnie niższe niż w Opus 4.7.

Nowe funkcje uruchomione tego samego dnia

  • Dynamic workflows. Funkcja w wersji research preview pozwala Claude na realizację bardzo dużych zadań w Claude Code: model planuje pracę, uruchamia setki równoległych subagentów w jednej sesji, a następnie weryfikuje wyniki przed przekazaniem ich użytkownikowi. Dostępna w planach Enterprise, Team i Max.
  • Effort control. Nowy element obok selektora modelu w claude.ai i Cowork pozwala wybrać, ile „wysiłku” Claude wkłada w odpowiedź. Wyższe ustawienia oznaczają głębsze myślenie i lepsze odpowiedzi, niższe – szybsze działanie. Funkcja dostępna we wszystkich planach.
  • Fast mode. Tryb, w którym model pracuje 2,5× szybciej, jest teraz trzy razy tańszy niż w poprzednich modelach.
  • Aktualizacja Messages API. API przyjmuje teraz wpisy systemowe wewnątrz tablicy messages, co pozwala aktualizować instrukcje modelu w trakcie zadania bez przerywania prompt cache.

Wybrane wyniki benchmarków

Dane pochodzą z Claude Opus 4.8 System Card (porównanie Opus 4.8 vs Opus 4.7):

BenchmarkOpus 4.8Opus 4.7
SWE-bench Pro69,2%64,3%
SWE-bench Verified88,6%87,6%
Terminal-Bench 2.174,6%66,1%
Humanity's Last Exam (bez narzędzi)49,8%
Humanity's Last Exam (z narzędziami)57,9%

Według testerów partnerskich Opus 4.8 uzyskał 84% na Online-Mind2Web (skok względem Opus 4.7 i GPT-5.5) oraz jako pierwszy model przekroczył próg 10% na Legal Agent Benchmark w standardzie all-pass.

Dostępność i ceny

Claude Opus 4.8 jest dostępny od dnia premiery. Ceny zwykłego użycia są niezmienione względem Opus 4.7: 5 USD za milion tokenów wejściowych i 25 USD za milion tokenów wyjściowych. Fast mode kosztuje 10 USD / 50 USD za milion tokenów. Deweloperzy korzystają z modelu przez Claude API jako claude-opus-4-8.

Co dalej

Anthropic pracuje nad modelami o zbliżonych do Opus możliwościach przy niższym koszcie oraz nad nową klasą modeli o jeszcze wyższej inteligencji. W ramach Project Glasswing wąska grupa organizacji korzysta już z Claude Mythos Preview do prac nad cyberbezpieczeństwem; modele klasy Mythos mają trafić do wszystkich klientów „w nadchodzących tygodniach”.