Začátek roku 2026 vypadá jako klasický “patch notes” pro realitu: pár zásadních novinek v jádru (architektury modelů), pár věcí pro power-usery (agenti, nástroje), a k tomu hardware, který se tváří, že si chce říct o výplatu navíc. Tady je z toho jeden čitelný, magazínový průlet.
1) DeepSeek a “nová kapitola” v tom, jak teče signál modelem
DeepSeek má mít novoroční paper, kde se klasický reziduální tok (“x + F(x)”) rozšiřuje do víc paralelních proudů a řeší se problém “hyper-propojení”, které ve velkém tréninku umí rozkmitat stabilitu a nafouknout signál do nepříčetna. Zajímavá je i zmínka o omezení spojovací matice pomocí Sinkhorn-Knopp algoritmu tak, aby se držela na určitém “manifold” (v textu je to popsané jako dvojitě kvazi-stochastická / “bistochastic” struktura). Pointa: chtějí víc cest pro informaci, ale bez toho, aby se model při škálování rozpadal.
Magazínový překlad do lidské řeči: “chceme širší dálnici pro informaci, ale zároveň svodidla, aby to neletělo ze zatáčky”.
2) MoE naráží na komunikaci: FUSCO a “vzdušné přeskupování”
U Mixture-of-Experts se už nějakou dobu ví, že výpočetně je to hezky “sparse”, jenže produkční realita je brutální: víc uživatelů, delší kontexty, víc agentních workflow a najednou se z úzkého hrdla nestane GPU, ale komunikace mezi experty a plánování přenosů. V tomhle kontextu se zmiňuje FUSCO (s otevřeným repem a arXiv odkazem), které má cílit na překopání datových přístupů a dynamické přeuspořádání tak, aby komunikace nebyla brzda pro “agentní explozi”.
Tohle je důležité: v roce agentů vyhrává ten, kdo umí škálovat nejen model, ale i potrubí mezi jeho částmi.
3) Google “comeback arc”: tři roky, co vypadají jako šachová partie
V datech je i text o tom, jak po nástupu ChatGPT (listopad 2022) údajně nastal uvnitř Googlu poplach, a jak následně firma tlačí Gemini a další modely (obraz, video) plus vlastní TPU. Narativ je jasný: návrat na technologický hřeben přes kombinaci modelů a infrastruktury.
Pro magazín je na tom nejzajímavější ten “meta” rozměr: AI není jen o tom mít model, ale mít celý ekosystém od čipů přes tooling až po distribuci.
4) Tesla FSD: 10 000 mil bez zásahu (podle reportu) jako test nervů i reality
Je tu i historka o jízdě napříč USA s FSD (verze uvedená v textu), údajně bez zásahu a včetně parkování i nabíjení. Ber to jako “výrazný claim”, který stojí za pozornost, protože pokud je to doložitelné daty, je to posun v tom, co veřejnost začne považovat za normální.
I kdyby se ukázalo, že realita je o chlup složitější než titulky, trend je zřejmý: autonomie se přestává řešit jako demo a začíná se řešit jako provoz.
5) GPU ceny: když paměť zdraží, AI se tváří kysele
V přehledu je i zpráva, že NVIDIA/AMD mohou v nejbližších měsících zdražovat, s vysvětlením, že roste podíl pamětí v celkové nákladové struktuře GPU. Včetně hodně ostrého příkladu, že se může reálná cena špičkových karet vyšplhat výrazně nad doporučenou.
Pro nadšence a malé týmy je to studená sprcha: optimalizace, kvantizace, distilace a chytřejší inference už nejsou “nice to have”, ale obranný štít proti účtence.
6) Robot do batohu: Q1 a návrat geek estetiky
Zmiňuje se i malý humanoid Q1 “do batohu”, s ideou snížit bariéru pro výzkum i hraní, otevřené nástroje a možnost si ho upravit (včetně 3D tisku “skinů”). Jestli se tohle rozjede, osobní robotika může dostat podobný moment, jako když se z počítačů staly domácí stroje pro každého.
Toolbox: co se objevilo na ModelScope (modely a agenti)
A teď to, co si čtenář-magor hned ukládá do “to-try” seznamu:
- Z-Image-Turbo: image model ~6B, destilovaná varianta s nízkým počtem kroků (NFEs), důraz na rychlost a použití i na spotřebním VRAM (dle popisu).
MiniMax-M2.1: multimodální LLM, dostupné API i open-source váhy (podle popisu).
Qwen-Image-2512: text-to-image, zmiňované rozsáhlé “blind” evaluace a claim o špičce mezi open-source.
Qwen-Image-Edit-2511: model na editaci obrázků s ukázkou použití přes diffusers pipeline.
GLM-4.7: orientace na coding + agentní scénáře, zmiňované zlepšení na SWE-bench a terminal úlohách.
AutoGLM-Phone-9B: “phone agent” přes ADB, multimodální čtení obrazovky, plánování kroků a provádění akcí, s mechanismem potvrzení citlivých operací.
Co z toho leze jako hlavní trend?
Rok 2026 nezačíná jednou velkou bombou. Začíná hned několika šrouby, které se dotahují ve stejný čas:
- architektury řeší stabilitu při škálování (DeepSeek),
- systémy řeší komunikaci a orchestrace (MoE + agenti),
- “produkční AI” se tlačí do aut, telefonů a robotů,
- a hardware si potichu brousí zuby na zdražení.
Jestli chcete “AI bez kompromisů”, tak přesně tohle je ta liga: méně plakátů, víc potrubí, svodidel, latence, pamětí a reality.
0 thoughts on “Novoroční zajímavosti: architektury, agenti, roboti a (možná) dražší železo”