Od Vibe Codingu k Agent Engineeringu: Čo sa skutočne zmenilo
Vo februári 2025 Andrej Karpathy uverejnil tweet, ktorý definoval éru: “There’s a new kind of coding I call vibe coding, where you fully give in to the vibes, embrace exponentials, and forget that the code even exists.”
O trinásť mesiacov neskôr v podcaste No Priors sám seba odcitoval naposledy.
“I went from 80/20 of writing code myself versus delegating to agents to like 2/98. I don’t think I’ve typed a line of code since December.”
Muž, ktorý nám dal “vibe coding”, ho teraz nazýva prekonaným. Jeho nový pojem: agentic engineering. Nie preto, že AI by bola horšia v generovaní kódu — ale preto, že generovanie kódu nikdy nebola tá ťažká časť.
Čo Karpathy skutočne povedal
Rozhovor v No Priors sa oplatí pozrieť celý, no tri zmeny vynikajú:
1. Pomer sa otočil. Karpathy prešiel od písania 80 % vlastného kódu na 2 %. Zvyšok zvládajú agenti. Úzke miesto sa presunulo od rýchlosti písania k schopnosti orchestrácie — ako dobre riadite viacero agentov pracujúcich paralelne.
2. “Kód už nie je ani správne sloveso.” Vývoj softvéru sa zmenil na orchestráciu makroakcií. Nepíšete funkcie; delegujete features. Nedebugujete riadok po riadku; revidujete na úrovni architektúry. Peter Steinberger riadi desiatky agentov súčasne, každý na 20-minútové úlohy naprieč viacerými repozitármi.
3. AutoResearch vyraďuje ľudí zo slučky úplne. Karpathy vytvoril autonómnu výskumnú slučku pre nanoGPT, ktorá beží cez noc a optimalizuje hyperparametre. Napriek jeho rokom manuálneho ladenia agent objavil zlepšenia, ktoré mu unikli — zabudnutý weight decay na value embeddings, nedostatočne vyladené Adam bety. Jeho záver: “To get the most out of the tools, you have to remove yourself as the bottleneck.”
Spoločná niť: hodnota sa presunula od vykonávania k úsudku. Vibe coding bol o vykonávaní — prompt, generuj, vydaj. Agentic engineering je o úsudku — architektúra, verifikácia, orchestrácia.
Inžinierska príručka pre to, čo príde ďalej
V rovnakom týždni Tw93 — tvorca Pake, Mole a produktívny open-source inžinier — vydal “You Don’t Know AI Agents,” hlboký technický sprievodca, ktorý pokrýva, čo skutočne treba na to, aby boli agenti spoľahliví v produkcii. Kde Karpathy poskytuje víziu, Tw93 poskytuje inžiniersku príručku.
Jeho ústredná téza: harnesses sú dôležitejšie ako modely.
“Using a more expensive model doesn’t always yield the massive improvements you’d expect. Instead, the quality of your harness and validation tests has a far greater impact on success rates.”
Toto nie je teória. Vlastný inžiniersky tím OpenAI to dokázal: traja inžinieri napísali milión riadkov kódu za päť mesiacov — desaťkrát rýchlejšie ako obvyklým spôsobom. Kľúčom nebol lepší model. Boli to správne inžinierske rozhodnutia o obmedzeniach, validácii a infraštruktúre agentov.
Päť princípov, ktoré odlišujú Vibe Coding od Agent Engineeringu
1. Context Engineering namiesto Prompt Engineeringu
Zložitosť pozornosti Transformera je O(n²). Čím dlhší kontext, tým ľahšie sa dôležité signály rozrieďujú. Najčastejší typ zlyhania nie je “model to nedokáže” — je to Context Rot: irelevantný obsah sa hromadí, kým kvalita rozhodnutí agenta viditeľne neklesne.
Riešením je vrstvené riadenie kontextu:
- Trvalá vrstva: Identita, konvencie, tvrdé obmedzenia. Krátke, stabilné, vždy načítané.
- Vrstva na vyžiadanie: Zručnosti a odborné znalosti. Deskriptory zostávajú rezidentné; plný obsah sa načíta len pri spustení.
- Runtime injekcia: Časové razítka, preferencie používateľov, dynamický stav. Pridané za každý ťah.
- Pamäťová vrstva: Medzireláciová skúsenosť. Čítaná len keď je relevantná, nie natlačená do každého promptu.
Kľúčové poznatky: nedávajte deterministickú logiku do kontextu. Čokoľvek vyjadriteľné ako kódové pravidlá, lintery alebo hooky by mali zvládnuť externé systémy. Model má myslieť, nie čítať príručky.
2. Dizajn nástrojov podľa ACI princípov
Väčšina zlyhaní nástrojov nie je spôsobená tým, že model vyberie nesprávny nástroj — ale tým, že nástroj bol navrhnutý pre inžinierov, nie pre agentov. Rámec Agent-Computer Interface (ACI) mení perspektívu dizajnu:
| Aspekt | Zlý dizajn nástroja | Dobrý dizajn nástroja |
|---|---|---|
| Granularita | Mapuje na API endpointy | Mapuje na ciele agenta |
| Vracia | Kompletné surové dáta | Polia relevantné pre ďalšie rozhodnutie |
| Chyby | Generický reťazec | Štruktúrované s návrhmi na opravu |
| Popis | Čo robí | Kedy ho použiť a kedy NIE |
Praktický príklad: namiesto poskytovania get_post + update_content + update_title ako samostatných nástrojov poskytnite update_yuque_post, ktorý vyjadrí celú akciu v jednom volaní. Protipríklady v popisoch nástrojov zvyšujú presnosť z 53 % na 85 %.
Pri debugovaní agentov najprv skontrolujte definície nástrojov. Väčšina chýb pri výbere nástrojov pochádza z nepresných popisov, nie z nedostatočných schopností modelu.
3. Pamäť ako infraštruktúra, nie ako dodatočný nápad
Agenti nemajú natívnu časovú kontinuitu. Keď relácia skončí, kontext je preč. Štyri typy pamäte riešia rôzne problémy:
- Pracovná pamäť (kontextové okno): Aktuálny stav úlohy. Aktívne spravovaný.
- Procedurálna pamäť (zručnosti): Ako robiť veci. Načítaná na požiadanie.
- Epizodická pamäť (logy relácií): Čo sa stalo. Uložené, vyhľadateľné.
- Sémantická pamäť (MEMORY.md): Stabilné fakty. Injektované pri spustení.
Kľúčové dizajnové rozhodnutie: konsolidácia pamäte musí byť reverzibilná. Pri komprimovaní dlhých konverzácií neodstraňujte surové správy — archivujte ich. Presuňte ukazovateľ, nezničte dáta. Ak konsolidácia vytvorí zlé zhrnutie, agent sa stále môže vrátiť k surovej histórii.
4. Hodnotenie pred optimalizáciou
Hodnotenie agentov je zásadne ťažšie ako tradičné testovanie. Priestor vstupov je nekonečný, LLM sú citlivé na formuláciu promptu a rovnaká úloha môže priniesť rôzne výsledky naprieč behmi.
Dve metriky, dva účely:
- Pass@k: Aspoň jeden správny beh z k. Testuje hranice schopností. Použite počas vývoja.
- Pass^k: Všetky k behy správne. Testuje spoľahlivosť. Použite pred nasadením.
Najnebezpečnejší anti-pattern: ladiť agenta, keď je hodnotenie nefunkčné. Ak je vaše skórovanie chybné, optimalizujete voči skresleným signálom. Keď výkon klesá, najprv skontrolujte infraštruktúru — limity zdrojov spôsobujúce pády, chybné hodnotiteľov, alebo testovacie prípady odpojené od reality — skôr než zmeníte agenta.
5. Koordinácia viacerých agentov vyžaduje protokoly
Prevádzka viacerých agentov nie je o paralelizme — je o izolácii a koordinácii. Subagenti by mali vracať len zhrnutia; ich hľadanie, pokus-omyl a debugovací proces zostáva v ich vlastnom kontexte. Kontext hlavného agenta dostáva len závery.
Poradie je dôležité: najprv definujte protokoly, potom nastavte izoláciu, potom hovorte o spolupráci. Bez štruktúrovanej komunikácie (JSONL fronty správ, grafy úloh, izolácia pracovného priestoru) sa chyby zosilňujú naprieč agentmi. Agent A sa odchýli, Agent B posilní zaujatosť, Agent C naň nastaví, a všetci traja konvergujú na nesprávny záver s vysokou istotou.
Vývoj v jednej tabuľke
| Fáza | Rola vývojára | Kvalita kódu | Verifikácia | Rozsah |
|---|---|---|---|---|
| Manuálne kódovanie | Pisár | Vysoká (váš kód) | Testujete sami | Jedna osoba |
| Vibe coding | Promptér | Variabilná | Kontrolujete sami | Jeden agent |
| Agentic coding | Architekt | Štruktúrovaná | Agent testuje sám seba | Viacero agentov |
| Agent engineering | Orchestrátor | Harness-podporovaná | Automatizované hodnotenie | Tímy agentov |
Každá fáza tú predchádzajúcu nenahradila — pohltila ju. Stále potrebujete vkus, stále potrebujete architektonické myslenie, stále potrebujete rozumieť kódu. Ale vrstva vykonávania sa stále vzďaľuje od vašich prstov.
Čo to znamená v praxi
Karpathy vytvoril agenta domácej automatizácie s názvom “Dobby the House Elf” — tri prompty, ktoré naskenovali jeho lokálnu sieť, reverzne spracovali API smart zariadení a nahradili šesť samostatných aplikácií WhatsApp príkazmi. “Dobby, sleepy time” všetko vypne.
Jeho záver o softvéri: “These apps shouldn’t even exist. Shouldn’t it just be APIs and agents are the glue of intelligence that tool-calls all the parts?”
Toto je trajektória. Softvér sa presúva od produktov, ktoré obsluhujete, k agentom, ktorí produkty obsluhujú vo vašom mene. Rozhranie sa zrúti z GUI na prirodzený jazyk. Zložitosť nezmizne — presunie sa do harnessu, nástrojov, hodnotenia, pamäťových systémov, ktoré robia agentov spoľahlivými.
Vibe coding nás zoznámil s myšlienkou, že AI píše kód. Agent engineering je o budovaní infraštruktúry, ktorá robí kód písaný AI dôveryhodným, udržiavateľným a autonómnym.
Viby boli krok 1. Engineering je všetko potom.
TeamDay prevádzkuje autonómnych AI agentov v cloude — SEO, obsah, sociálne médiá, analytika a ďalšie. Rovnaké princípy agent engineeringu, ktoré opisujú Karpathy a Tw93, poháňajú našu AI pracovnú silu. Začnite budovať váš tím agentov.