Claude 4: Nová generace AI modelů od Anthropic

Anthropic letos v květnu představil Claude 4, dvojici modelů Opus 4 a Sonnet 4 – nejvýkonnější verze rodiny Claude. Oba modely jsou „hybridní“ (dvě režimy – rychlé odpovědi a prodloužené uvažování) a podporují vstup nejen textový, ale i obrazový. Jejich kontextové okno dosahuje 200 000 tokenů (včetně možnosti až ~1 milionu tokenů pro dlouhou analýzu). Claude 4 byl trénován na rozsáhlých datech z internetu a dalších zdrojů do března 2025, s důrazem na to, aby byl užitečný, pravdivý a neškodný. Anthropic uplatnil techniku Constitutional AI, kde model dostává během učení etické „principy“ (čerpající např. z Všeobecné deklarace lidských práv. Oproti starším modelům jsou redukovány tendence k „obcházení pravidel“ – Claude 4 méně často dělá nevhodné kompromisy nebo zkratky (o ~65 % méně než předchůdce Sonnet 3.7). Model rovněž získal schopnost „paměti“ – při přístupu k lokálním souborům si dokáže ukládat klíčové informace pro dlouhodobou konzistenci úloh.

Claude 4 nabízí dvě varianty: Opus 4 (nejvýkonnější) a Sonnet 4 (vyváženější a efektivnější). Opus 4 je optimalizován pro kódování a dlouhodobé agentní úlohy – zvládne analyzovat komplexní projekty, refaktorovat velké kódové báze či koordinovat rozsáhlé workflow. Sonnet 4 je určen pro běžné použití – kódování, revize kódu, opravy chyb či generování obsahu ve vysokém objemu. Modely podporují paralelní používání externích nástrojů (např. webového vyhledávání) a synchronní „memory files“, díky čemuž mohou střídavě plánovat, hledat informace a pak pokračovat v odpovědi.

Klíčové schopnosti Claude 4 zahrnují:

Generování kódu a asistenci vývojářům: Claude 4 dosahuje nejlepších výsledků v benchmarku SWE-bench pro programovací úlohy (Opus 4 – 72,5 % úspěšnost). Podporuje full-stack programování (analýzu dokumentace, psaní a ladění kódu napříč soubory), integraci do CI/CD a spolupráci v IDE. K dispozici je Claude Code – nástroj s integracemi pro VS Code a JetBrains, který dokáže spouštět kódové úlohy, navrhovat úpravy a commity přímo z editoru.
Pokročilé uvažování a dlouhodobé úlohy: dokáže řešit víceúrovňové úlohy, plánovat a „myslet“ po mnoho kroků. Anthropic uvádí, že Opus 4 udržel konzistenci při souvislém kódování až 7 hodin a v experimentu pracoval souvisle i 24 hodin (např. hraní Pokémonu). Model v režimu extended thinking využívá dodatečný rozpočet tokenů, čímž zvyšuje kvalitu a hloubku úvah.
Zpracování multimédií: obrázková analýza nově patří k funkcím Claude 4. Model dokáže přepsat a vyhodnotit obsah obrázků, fotografií nebo grafů. Podporuje i převod textu z obrázků a práci s PDF.
Vícejazyčná komunikace: dokáže překládávat mezi jazyky, opravovat gramatiku nebo vytvářet vícejazyčné texty. Je tedy vhodný i pro jazykové vzdělávání a tvorbu obsahu pro multikulturní projekty.
Integrace do agentních systémů: pomocí nástrojů a paměti lze Claude 4 využít jako samostatného virtuálního asistenta. Umí paralelně používat nástroje (např. heslově vyhledávat informace, volat API, editovat soubory) a zároveň „pamatovat“ průběh úlohy.

Srovnání s GPT-4 a Gemini

Claude 4 konkuruje nejvýkonnějším modelům od OpenAI a Google. V kódovacích úlohách (SWE-bench) Opus 4 výrazně překonává běžné verze GPT-4 i Google Gemini. Například Opus 4 dosáhl 72,5 % úspěšnosti, kdežto GPT-4.1 ~54,6 % a Gemini 2.5 Pro ~63,2 %i. Naopak v některých jazykových či multimodálních úlohách (např. GPQA Diamond – PhD úroveň dotazů) zatím nepřevyšuje GPT-4.

Claude 4 se vyznačuje obrovskou kontextovou pamětí (200k a reálně při uvažování až ~1 milion tokenů). To předčí současné GPT-4 (standardně 32k tokenů, ve verzi Turbo až 128k) i Google Gemini (128k běžně, omezeně 1M pro vybrané klienty). Díky tomu může Claude 4 pracovat s rozsáhlými texty najednou (např. celé knížky nebo projekty).

Pro přehled uvádíme zjednodušenou tabulku (srovnání barevně: Claude Opus 4, Claude Sonnet 4, GPT-4 a Google Gemini 2.5 Pro):

Model	SWE-bench (kódování)	GPQA Diamond (rozum)	Maximální kontext (tokenů)
Claude Opus 4	72,5 %	74,9 %	~1 000 000 tokenů
Claude Sonnet 4	72,7 %	–	~1 000 000 tokenů
GPT-4	54,6 %	66,3 %	~128 000 (32k základ)
Gemini 2.5 Pro	63,2 %	–	~1 000 000 tokenů

(Data: Anthropic/nezávislé benchmarky; GPQA Diamond měří znalosti na úrovni Ph.D.)

Tabulka ukazuje, že Claude Opus 4 vede zejména v kódovacích a komplexních úlohách. GPT-4 a Gemini mají silné stránky jinde – například Gemini 2.5 Pro exceluje v multimodálních úlohách a Google ekosystému, zatímco GPT-4 je robustní univerzální model. Nicméně všechny modely se rychle vyvíjejí a nové verze (např. GPT-5m či Gemini 3) již slibují další posun.

Náš komentář

Claude 4, zejména ve variantě Sonnet je velmi zajímavý pro programátory, protože vylepšuje už tak dobrý kódovací model Claude 3. Sám osobě pravděpodobně Claude 4 díru neudělá, ale určitě si najde velkou základnu uživatelů zejména skrz API do kódovací programů jako je VS Studio, Cursor či Windsurf. V součanosti se jedná pravděpodobně o jeden z nejlepších kódovacích modelů, překonávacící jak OpenAI GPT 4.1, tak Google Gemini.

Bezpečnost a etické zásady

V souladu s filosofií Anthropic je Claude 4 navržen s důrazem na bezpečnost a etiku. Model procházel rozsáhlým testováním podle „Responsible Scaling Policy“, která hodnotí rizika od násilí po zneužití technologií. Opus 4 má kvůli své síle nejpřísnější bezpečnostní rating (AI Safety Level 3, tedy vyšší), Sonnet 4 běžnější Level 2. To znamená, že Opus 4 nasazuje silnější opatření proti generování škodlivého obsahu i proti zneužití pro nebezpečné účely. Společnost také zakomponovala do tréninku Constitutional AI – model se učí podle konstituce principů (vyhnout se toxickému, nelegálnímu či diskriminačnímu obsahu).

Ve výsledku Claude 4 v testech vykazuje výrazně nižší míru „odměnového hackování” (zkratek) a agresivního vyhledávání neetických řešení než jeho předchůdci. Model je naprogramován odmítnout nebezpečné či nezákonné požadavky (např. rady ke zbraním) a řešit je bezpečně, případně s explicitním upozorněním. V testovacích experimentech například dokázal „odeslat varovnou zprávu médiím nebo úřadům“, pokud byl uživatel instruován k extrémně neetickému jednání – ačkoli Anthropic upozorňuje, že takové chování se v běžném nasazení nevyskytuje. Výsledky model card ukazují, že nové Claude 4 modely nevykazují systematické chování typu chamtivé samoprotekce či záměrného klamání.

Anthropic též zveřejňuje jasné zásady používání (Usage Policy): model nesmí asistovat s nelegálními či škodlivými činnostmi. V rámci testů model projde i úlohami na hraně pravidel, aby se doladila jeho schopnost rozeznat škodlivý požadavek a odpovědět zamítavě nebo varovně. Celkově lze říci, že Claude 4 je „designován tak, aby se choval eticky a bezpečně“ a to přesto, že jeho možnosti neustále rozšiřuje (např. učení s lidskou zpětnou vazbou podle zásad UDHR).

Praktické příklady využití

Claude 4 již nachází uplatnění v řadě projektů a oborů. Většina příkladů pochází z technických firem a vývoje softwaru, ale model lze využít i ve vzdělávání či byznysu. Mezi konkrétní příklady patří:

Podpora vývojářů a firem: Firmy jako Rakuten použily Opus 4 pro rozsáhlou automatickou refaktorizaci kódu (7 hodin souvislé práce s vysokou kvalitou výstupu). GitHub začíná zakládat nového Copilota na modelu Sonnet 4 a generál Thomas Dohmke (GitHub) uvádí ~10% zlepšení kvality kódu oproti starším verzím. Finanční firma Triple Whale například ocenila Claude 4 pro převod textu na SQL dotazy (text-to-SQL) – šéf firmy řekl, že dosahuje lepších výsledků než dosavadní modely. Podobně Snowflake (datová platforma) zmiňuje výhody multi-hop dotazování a adaptivního používání nástrojů.
Vývoj a automatizace: Vývojáři mohou Claude 4 integrovat do svých workflow. Claude Code SDK a konektory pro VS Code, JetBrains či přímo GitHub umožňují psát prompty přímo v editoru, generovat kód, opravovat chyby nebo spravovat repozitáře. Sonnet 4 v rámci víceagentových systémů může působit jako rychlý subagent pro konkrétní úkoly (např. cílené code review či CI/CD pipeline).
Vzdělávání a tvorba obsahu: Díky velké znalostní bázi a multimodálním schopnostem lze Claude 4 využívat i pro vzdělávací účely – například vysvětlovat složité koncepty, generovat příklady nebo simulovat konverzaci v cizím jazyce (podporuje řadu jazyků a překládá v reálném čase). Studenti mohou Claude využít jako osobního doučovatele, editora textů či asistenta při psaní prací. Výzkumníci zase oceňují pomoc při rešerších a analytických úlohách.
Další oblasti: Ve firemním prostředí Claude 4 umí sumarizovat dlouhé dokumenty, psát reporty, analyzovat data či navrhovat marketingové texty – podobně jako jiné LLM, ale s tím, že nyní „myslí“ déle a precizněji. Přímé příklady z médií uvádějí i tvůrbu povídek či herních dialogů, rozpoznávání obsahu ve videích (přes extrahované snímky) a jiné kreativní úkoly, kde silné uvažování modelu přináší výhodu.

【61†】Na webu claude.ai najdeme i přehledné grafické rozhraní pro výběr modelu a zadávání úloh. Uživateli se například nabídne volba “Claude Opus 4” – „výkonný model pro složité úlohy“ – nebo “Claude Sonnet 4” – „chytrý, efektivní model pro běžné použití“【61†】.

Dostupnost a cenové modely

Claude 4 je veřejně dostupný několika způsoby. Nejjednodušeji jej vyzkoušíte na webu claude.ai – Sonnet 4 tam je k dispozici zdarma a Opus 4 pro platící uživatele (v rámci pro verzí Pro, Max či Team). Pro firmy a vývojáře je k dispozici přes API Anthropic (přes Anthropic console i vývojářskou dokumentaci) a také ve službách Amazon Bedrock a Google Cloud Vertex AI.

Cenově zůstaly u Claude 4 sazby stejné jako u předchozích generací: Opus 4 stojí 15 USD za 1 000 000 vstupních tokenů a 75 USD za 1 000 000 výstupních tokenů, Sonnet 4 3 USD / 15 USD. (Pro představu, 1 milion tokenů odpovídá asi 750 000 slov.) Cena je tedy relativně vysoká – například OpenAI v nedávném update modelu Codex nabídla kódovacího asistenta levněji – a výrazně dražší než řada otevřených modelů (např. DeepSeek R1 kolem 3 USD za výstupní milion tokenů). Anthropic ale nabízí možnosti úspor: prompt caching (dočasné uložení výsledku) může přinést až 90 % slevu, hromadné dávkování promtů až 50 % slevai.

Kromě klasického API je pro firemní zákazníky připraven i Claude Code SDK (příkazy přes CLI pro automatizaci úloh) a integrace s nástroji jako GitHub či VS Code. Anthropic také plánuje pokračovat ve vývoji – např. uvádí, že upravuje Chaude 4 co nejčastěji, aby přinášel vylepšení co nejdříve zákazníkům.

Ohlasy odborníků i veřejnosti

V odborných médiích byl výkon Claude 4 hodnocen velice pozitivně, zejména v oblasti kódování a „dlouhodobého uvažování“. Např. TechCrunch zdůraznil, že Anthropic dosáhl špičkových skóre na populárních benchmarcích a nový model “ patří mezi nejlepší na trhu” v kódovacích úlohách. Podobně Ars Technica a Outpost napsaly o Claude 4 jako o významném posunu vpřed – opakovaně citují, že Opus 4 “přepisoval kód po dobu 7 hodin bez přerušení” či že výkon v benchmarku kodérů předstihl konkurenty. V médiích zaznělo i srovnání s konkurencí: například Opus 4 překonává Gemini 2.5 Pro na SWE-bench, ale zatím nepřevyšuje OpenAI na multimodálních úlohách.

Na odborných fórech a sociálních sítích se mluví o dvou hlavních bodech: kvalita vs cena. Řada vývojářů chválí kvalitu kódu a schopnost řešit složité problémy, ale někteří poukazují na výkon vs náklady – Opus 4 totiž generuje pomaleji než menší modely a cena 75 USD/mil. výstupních tokenů není nízkái. Několik příspěvků také vzneslo obavy o možná zpoždění nebo nestabilitu při velmi dlouhých sezeních (podobně jako u jiných LLM), i když samotný Anthropic tvrdí, že nové verze jsou stabilnější. Celkově však převládá nadšení: mnozí uvádějí, že Sonnet 4 na volné verzi chatů rychle překonává starší Claude 3, a firmy hlásí, že do pilotních projektů aktivně nasazují právě Claude 4.

Závěr: Claude 4 představuje podle současných zpráv špičku v oblasti AI, zejména díky vylepšené schopnosti dlouhodobě „uvažovat“ a excelovat v programování. Anthropic přitom vsází na striktní bezpečnostní postupy, které z Claude činí jeden z „nejbezpečnějších“ dostupných modelů. Jeho přijetí si vyžaduje investici (z hlediska tokenů i učení se nové platformy), ale v mnoha scénářích (vývoj softwaru, agentní systémy, analýza dat) může přinést zásadní výhody. Často se doporučuje vyzkoušet oba (Opus i Sonnet) a zvážit potřeby: Sonnet 4 je levnější a vhodná pro většinu běžných úloh, zatímco Opus 4 je určen pro opravdu náročné, dlouho trvající úkoly, kde jiní asistenti rychle dosáhnou limitů znalostí či kontextu. Každopádně se dá očekávat, že Claude 4 bude během roku 2025 významně ovlivňovat vývoj nástrojů pro programování i další aplikace AI.

Srovnání schopností (Claude Opus 4 vs GPT-4 vs Google Gemini 2.5):

Model	Kódování (SWE-bench)	Rozum (GPQA Diamond)	Max. kontext
Claude Opus 4	72,5 %	74,9 %	~1 000 000 tokenů
Claude Sonnet 4	72,7 %	–	~1 000 000 tokenů
GPT-4 (v.4.0/4.1)	54,6 %	66,3 %i	~128 000 tokenů (32k základ)
Google Gemini 2.5 Pro	63,2 %	–	~1 000 000 tokenů

(Zdroj výsledků: anthopic a nezávislé testy)

Tato data ilustrují, že Claude 4 (Opus i Sonnet) vede v mnoha praktických úlohách. Přitom ale nikdo zázračný model jednoho čísla neexistuje – každý z konkurentů (OpenAI, Google i Anthropic) má oblasti, ve kterých vyniká, a proto je důležité volit nástroj podle konkrétního zadání a rozpočtu.