POST_ID: 128

> Novoroční zajímavosti: architektury, agenti, roboti a (možná) dražší železo_

IMG_SOURCE: Meshy_AI_ed5a8666b6b798a4a867dd41e773c5fe400830956f998d91721b8f0fd9eefbb3.png 1376x768
cc822b0b 3efe03fa a9e6a34c d0204ccc

Začátek roku 2026 vypadá jako klasický “patch notes” pro realitu: pár zásadních novinek v jádru (architektury modelů), pár věcí pro power-usery (agenti, nástroje), a k tomu hardware, který se tváří, že si chce říct o výplatu navíc. Tady je z toho jeden čitelný, magazínový průlet.


1) DeepSeek a “nová kapitola” v tom, jak teče signál modelem

DeepSeek má mít novoroční paper, kde se klasický reziduální tok (“x + F(x)”) rozšiřuje do víc paralelních proudů a řeší se problém “hyper-propojení”, které ve velkém tréninku umí rozkmitat stabilitu a nafouknout signál do nepříčetna. Zajímavá je i zmínka o omezení spojovací matice pomocí Sinkhorn-Knopp algoritmu tak, aby se držela na určitém “manifold” (v textu je to popsané jako dvojitě kvazi-stochastická / “bistochastic” struktura). Pointa: chtějí víc cest pro informaci, ale bez toho, aby se model při škálování rozpadal.

Magazínový překlad do lidské řeči: “chceme širší dálnici pro informaci, ale zároveň svodidla, aby to neletělo ze zatáčky”.


2) MoE naráží na komunikaci: FUSCO a “vzdušné přeskupování”

U Mixture-of-Experts se už nějakou dobu ví, že výpočetně je to hezky “sparse”, jenže produkční realita je brutální: víc uživatelů, delší kontexty, víc agentních workflow a najednou se z úzkého hrdla nestane GPU, ale komunikace mezi experty a plánování přenosů. V tomhle kontextu se zmiňuje FUSCO (s otevřeným repem a arXiv odkazem), které má cílit na překopání datových přístupů a dynamické přeuspořádání tak, aby komunikace nebyla brzda pro “agentní explozi”.

Tohle je důležité: v roce agentů vyhrává ten, kdo umí škálovat nejen model, ale i potrubí mezi jeho částmi.


3) Google “comeback arc”: tři roky, co vypadají jako šachová partie

V datech je i text o tom, jak po nástupu ChatGPT (listopad 2022) údajně nastal uvnitř Googlu poplach, a jak následně firma tlačí Gemini a další modely (obraz, video) plus vlastní TPU. Narativ je jasný: návrat na technologický hřeben přes kombinaci modelů a infrastruktury.

Pro magazín je na tom nejzajímavější ten “meta” rozměr: AI není jen o tom mít model, ale mít celý ekosystém od čipů přes tooling až po distribuci.


4) Tesla FSD: 10 000 mil bez zásahu (podle reportu) jako test nervů i reality

Je tu i historka o jízdě napříč USA s FSD (verze uvedená v textu), údajně bez zásahu a včetně parkování i nabíjení. Ber to jako “výrazný claim”, který stojí za pozornost, protože pokud je to doložitelné daty, je to posun v tom, co veřejnost začne považovat za normální.

I kdyby se ukázalo, že realita je o chlup složitější než titulky, trend je zřejmý: autonomie se přestává řešit jako demo a začíná se řešit jako provoz.


5) GPU ceny: když paměť zdraží, AI se tváří kysele

V přehledu je i zpráva, že NVIDIA/AMD mohou v nejbližších měsících zdražovat, s vysvětlením, že roste podíl pamětí v celkové nákladové struktuře GPU. Včetně hodně ostrého příkladu, že se může reálná cena špičkových karet vyšplhat výrazně nad doporučenou.

Pro nadšence a malé týmy je to studená sprcha: optimalizace, kvantizace, distilace a chytřejší inference už nejsou “nice to have”, ale obranný štít proti účtence.


6) Robot do batohu: Q1 a návrat geek estetiky

Zmiňuje se i malý humanoid Q1 “do batohu”, s ideou snížit bariéru pro výzkum i hraní, otevřené nástroje a možnost si ho upravit (včetně 3D tisku “skinů”). Jestli se tohle rozjede, osobní robotika může dostat podobný moment, jako když se z počítačů staly domácí stroje pro každého.


Toolbox: co se objevilo na ModelScope (modely a agenti)

A teď to, co si čtenář-magor hned ukládá do “to-try” seznamu:

  • Z-Image-Turbo: image model ~6B, destilovaná varianta s nízkým počtem kroků (NFEs), důraz na rychlost a použití i na spotřebním VRAM (dle popisu).

MiniMax-M2.1: multimodální LLM, dostupné API i open-source váhy (podle popisu).

Qwen-Image-2512: text-to-image, zmiňované rozsáhlé “blind” evaluace a claim o špičce mezi open-source.

Qwen-Image-Edit-2511: model na editaci obrázků s ukázkou použití přes diffusers pipeline.

GLM-4.7: orientace na coding + agentní scénáře, zmiňované zlepšení na SWE-bench a terminal úlohách.

AutoGLM-Phone-9B: “phone agent” přes ADB, multimodální čtení obrazovky, plánování kroků a provádění akcí, s mechanismem potvrzení citlivých operací.


Co z toho leze jako hlavní trend?

Rok 2026 nezačíná jednou velkou bombou. Začíná hned několika šrouby, které se dotahují ve stejný čas:

  • architektury řeší stabilitu při škálování (DeepSeek),
  • systémy řeší komunikaci a orchestrace (MoE + agenti),
  • “produkční AI” se tlačí do aut, telefonů a robotů,
  • a hardware si potichu brousí zuby na zdražení.

Jestli chcete “AI bez kompromisů”, tak přesně tohle je ta liga: méně plakátů, víc potrubí, svodidel, latence, pamětí a reality.


0 thoughts on “Novoroční zajímavosti: architektury, agenti, roboti a (možná) dražší železo

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *