Od Vibe Codingu k Agent Engineeringu: Co se skutečně změnilo
V únoru 2025 Andrej Karpathy uveřejnil tweet, který definoval celou éru: “There’s a new kind of coding I call vibe coding, where you fully give in to the vibes, embrace exponentials, and forget that the code even exists.”
O třináct měsíců později v podcastu No Priors sám sebe citoval naposledy.
“I went from 80/20 of writing code myself versus delegating to agents to like 2/98. I don’t think I’ve typed a line of code since December.”
Muž, který nám dal „vibe coding”, ho teď nazývá zastaralým. Jeho nový termín: agentic engineering. Ne proto, že by AI generovala kód hůř — ale proto, že generování kódu nikdy nebylo tou těžkou částí.
Co Karpathy skutečně řekl
Rozhovor v No Priors stojí za zhlédnutí celý, ale tři posuny vynikají:
1. Poměr se obrátil. Karpathy přešel od psaní 80 % vlastního kódu na 2 %. Zbytek zvládají agenti. Úzké místo se přesunulo od rychlosti psaní ke schopnosti orchestrace — jak dobře řídíte více agentů pracujících paralelně.
2. „Kód už ani není správné sloveso.” Vývoj softwaru se změnil na orchestraci makroakcí. Nepíšete funkce; delegujete funkcionality. Nedebugujete řádek po řádku; revidujete na úrovni architektury. Peter Steinberger provozuje desítky agentů současně, každý na 20minutové úkoly napříč více repozitáři.
3. AutoResearch vyřazuje lidi ze smyčky úplně. Karpathy vybudoval autonomní výzkumnou smyčku pro nanoGPT, která běží přes noc a optimalizuje hyperparametry. Navzdory jeho letům ručního ladění agent objevil zlepšení, která mu unikla — zapomenuté weight decay na value embeddings, nedostatečně vyladěné Adam bety. Jeho závěr: “To get the most out of the tools, you have to remove yourself as the bottleneck.”
Společná nit: hodnota se přesunula od provádění k úsudku. Vibe coding byl o provádění — promptuj, generuj, nasaď. Agentic engineering je o úsudku — architektura, verifikace, orchestrace.
Inženýrský manuál pro to, co přijde dál
Ve stejném týdnu Tw93 — tvůrce Pake, Mole a produktivní open-source inženýr — vydal „You Don’t Know AI Agents,” hluboký technický průvodce pokrývající to, co je skutečně potřeba, aby byli agenti spolehliví v produkci. Kde Karpathy poskytuje vizi, Tw93 poskytuje inženýrský manuál.
Jeho ústřední teze: harnesses jsou důležitější než modely.
“Using a more expensive model doesn’t always yield the massive improvements you’d expect. Instead, the quality of your harness and validation tests has a far greater impact on success rates.”
To není teorie. Vlastní inženýrský tým OpenAI to prokázal: tři inženýři napsali milion řádků kódu za pět měsíců — desetkrát rychleji než tradičním způsobem. Klíčem nebyl lepší model. Byla to správná inženýrská rozhodnutí o omezeních, validaci a infrastruktuře agentů.
Pět principů, které oddělují Vibe Coding od Agent Engineeringu
1. Context Engineering namísto Prompt Engineeringu
Složitost pozornosti Transformeru je O(n²). Čím delší kontext, tím snadněji se klíčové signály zředí. Nejčastější typ selhání není „model to neumí” — je to Context Rot: irelevantní obsah se hromadí, dokud kvalita rozhodnutí agenta viditelně neklesne.
Řešením je vrstvená správa kontextu:
- Trvalá vrstva: Identita, konvence, tvrdá omezení. Krátká, stabilní, vždy načtená.
- Vrstva na vyžádání: Dovednosti a odborné znalosti. Deskriptory zůstávají rezidentní; plný obsah se načte jen při spuštění.
- Runtime injekce: Časová razítka, uživatelské preference, dynamický stav. Přidáno za každý tah.
- Paměťová vrstva: Mezirelační zkušenost. Čtena jen když je relevantní, ne nacpaná do každého promptu.
Klíčový poznatek: nedávejte deterministickou logiku do kontextu. Cokoliv vyjádřitelné jako kódová pravidla, lintery nebo hooky by měly zvládnout externí systémy. Model má myslet, ne číst příručky.
2. Návrh nástrojů podle ACI principů
Většina selhání nástrojů není způsobena tím, že model vybere špatný nástroj — ale tím, že nástroj byl navržen pro inženýry, ne pro agenty. Rámec Agent-Computer Interface (ACI) mění perspektivu návrhu:
| Aspekt | Špatný návrh nástroje | Dobrý návrh nástroje |
|---|---|---|
| Granularita | Mapuje na API endpointy | Mapuje na cíle agenta |
| Vrací | Kompletní surová data | Pole relevantní pro další rozhodnutí |
| Chyby | Obecný řetězec | Strukturované s návrhy na opravu |
| Popis | Co dělá | Kdy ho použít a kdy NE |
Praktický příklad: namísto poskytování get_post + update_content + update_title jako samostatných nástrojů poskytněte update_yuque_post, který vyjádří celou akci v jednom volání. Protipříklady v popisech nástrojů zvyšují přesnost z 53 % na 85 %.
Při debugování agentů nejprve zkontrolujte definice nástrojů. Většina chyb při výběru nástrojů pochází z nepřesných popisů, ne z nedostatečných schopností modelu.
3. Paměť jako infrastruktura, ne jako dodatečný nápad
Agenti nemají nativní časovou kontinuitu. Když relace skončí, kontext je pryč. Čtyři typy paměti řeší různé problémy:
- Pracovní paměť (kontextové okno): Aktuální stav úkolu. Aktivně spravovaná.
- Procedurální paměť (dovednosti): Jak dělat věci. Načtena na požádání.
- Epizodická paměť (logy relací): Co se stalo. Uložená, prohledávatelná.
- Sémantická paměť (MEMORY.md): Stabilní fakta. Injektována při spuštění.
Klíčové návrhové rozhodnutí: konsolidace paměti musí být reverzibilní. Při komprimaci dlouhých konverzací neodstraňujte surové zprávy — archivujte je. Přesuňte ukazatel, nezničte data. Pokud konsolidace vytvoří špatné shrnutí, agent se stále může vrátit k surové historii.
4. Hodnocení před optimalizací
Hodnocení agentů je zásadně těžší než tradiční testování. Prostor vstupů je nekonečný, LLM jsou citlivé na formulaci promptu a stejný úkol může přinést různé výsledky napříč běhy.
Dvě metriky, dva účely:
- Pass@k: Alespoň jeden správný běh z k. Testuje hranice schopností. Používejte během vývoje.
- Pass^k: Všechny k běhy správné. Testuje spolehlivost. Používejte před nasazením.
Nejnebezpečnější anti-pattern: ladit agenta, když je hodnocení nefunkční. Pokud je vaše skórování chybné, optimalizujete vůči zkresleným signálům. Když výkon klesá, nejprve zkontrolujte infrastrukturu — limity zdrojů způsobující pády, chybné hodnotitele, nebo testovací případy odpojené od reality — než změníte agenta.
5. Koordinace více agentů vyžaduje protokoly
Provoz více agentů není o paralelismu — je o izolaci a koordinaci. Subagenti by měli vracet pouze shrnutí; jejich hledání, pokus-omyl a debugovací proces zůstává v jejich vlastním kontextu. Kontext hlavního agenta dostává pouze závěry.
Pořadí je důležité: nejprve definujte protokoly, pak nastavte izolaci, pak mluvte o spolupráci. Bez strukturované komunikace (JSONL fronty zpráv, grafy úkolů, izolace pracovního prostoru) se chyby zesilují napříč agenty. Agent A se odchýlí, Agent B posílí zaujatost, Agent C na to nastaví, a všichni tři konvergují na špatný závěr s vysokou jistotou.
Vývoj v jedné tabulce
| Fáze | Role vývojáře | Kvalita kódu | Verifikace | Rozsah |
|---|---|---|---|---|
| Ruční kódování | Pisatel | Vysoká (váš kód) | Testujete sami | Jedna osoba |
| Vibe coding | Promptér | Variabilní | Kontrolujete sami | Jeden agent |
| Agentic coding | Architekt | Strukturovaná | Agent testuje sám sebe | Více agentů |
| Agent engineering | Orchestrátor | Harness-podporovaná | Automatizované hodnocení | Týmy agentů |
Každá fáze tu předchozí nenahradila — pohltila ji. Stále potřebujete vkus, stále potřebujete architektonické myšlení, stále potřebujete rozumět kódu. Ale vrstva provádění se stále vzdaluje od vašich prstů.
Co to znamená v praxi
Karpathy vytvořil agenta domácí automatizace jménem „Dobby the House Elf” — tři prompty, které proskenovaly jeho místní síť, metodou reverse engineeringu dešifrovaly API chytrých zařízení a nahradily šest samostatných aplikací příkazy přes WhatsApp. „Dobby, sleepy time” vše vypne.
Jeho závěr o softwaru: “These apps shouldn’t even exist. Shouldn’t it just be APIs and agents are the glue of intelligence that tool-calls all the parts?”
Toto je trajektorie. Software se přesouvá od produktů, které ovládáte, k agentům, kteří produkty ovládají vaším jménem. Rozhraní se zhroutí z GUI na přirozený jazyk. Složitost nezmizí — přesune se do harnessu, nástrojů, hodnocení, paměťových systémů, které dělají agenty spolehlivými.
Vibe coding nás naučil, že AI píše kód. Agent engineering je o budování infrastruktury, která dělá kód psaný AI důvěryhodným, udržovatelným a autonomním.
Viby byly krok 1. Engineering je vše potom.
TeamDay provozuje autonomní AI agenty v cloudu — SEO, obsah, sociální média, analytika a další. Stejné principy agent engineeringu, které popisují Karpathy a Tw93, pohánějí naši AI pracovní sílu. Začněte budovat váš tým agentů.