9 pilierov produkčných AI agentov: Čo vám nikto nepovie pred nasadením

Váš demo agent funguje. Váš produkčný agent nebude.

AI agenta dokáže postaviť každý za víkend. Hodíte LLM API volanie do slučky, pridáte vyhľadávací nástroj, nasadíte na Vercel. Hotovo. Ideme.

Potom príde realita.

Váš agent halucinuje finančné dáta. Vykoná rm -rf / na vašom serveri. Unikajú mu osobné údaje zákazníkov naprieč hranicami tenantov. Premrhaná $2 000 v tokenoch cez noc, lebo nikto nenastavil limit.

Rozdiel medzi demo agentom a produkčným agentom nie je v kóde — je v infraštruktúre. A v roku 2026 má táto infraštruktúra meno: Agent Harness.

„Agent = Model + Harness. Ak nie si model, si harness.“
— Vivek Trivedy, LangChain

Tento článok rozoberá 9 základných pilierov, ktoré každý produkčný AI agent potrebuje. Žiadne klišé. Žiadne „záleží od situácie.“ Len konkrétne stavebné bloky — overené v praxi spoločnosťami ako AWS, Anthropic, LangChain a open-source komunitou.

Pilier 1: Agent Harness (Orchestračná vrstva)

Harness je všetko, čo nie je model. Je to while-slučka, stavový automat, if tool_call then execute logika. P Premení jednoduché bezstavové API na inteligentný uvažovací nástroj.

Čo robí:

Spravuje ReAct slučku agenta (Uvažuj → Konaj → Pozoruj → Opakuj)
Smeruje medzi uzlami stavového grafu (LangGraph, AWS Step Functions)
Spravuje kontextové okno, kompakciu a pokračovanie
Riadi výber nástrojov a poradie ich vykonávania

Kľúčové technológie:

LangGraph — Stavové, cyklické spúšťanie grafov s vstavaným checkpointingom. Skompiluje agenta raz pri štarte, nástroje a LLM vkladá pri volaní. Používaný v produkcii Linkedinom, Uberom a 400+ spoločnosťami.
AWS Bedrock AgentCore Runtime — Serverless nasadenie agentov s izoláciou relácií, podporujúce všetko od konverzácií s nízkou latenciou až po 8-hodinové asynchrónne záťaže.
Deep Agents (LangChain) — Open-source, model-agnostický harness so súborovým systémom, plánovaním, subagentmi a middlewarom v základe.

Zlaté pravidlo: Začnite jednoducho. Vlastné odporúčanie Anthropicu: „Nájdite čo najjednoduchšie riešenie a náročnosť zvyšujte len vtedy, keď je to potrebné.“ Väčšina produkčných agentov je ReAct slučka — nie 47-uzlový orchestračný graf.

Pilier 2: Nástroje a MCP (Ruky agenta)

Model bez nástrojov je filozof. Myslí krásne, ale nedokáže nič urobiť.

Nástroje sú spôsob, akým agenti komunikujú s vonkajším svetom — vyhľadávajú na webe, čítajú databázy, posielajú e-maily, vytvárajú dokumenty. A v roku 2026 Model Context Protocol (MCP) sa stal univerzálnym štandardom na prepojenie agentov s nástrojmi.

Čo produkčné systémy nástrojov potrebujú:

Dynamic assembly — Nástroje nasadené na každú požiadavku podľa konfigurácie agenta, nie zabudované v grafe
MCP servers — Štandardizovaný protokol pre objavovanie a spúšťanie nástrojov (40+ predpripravených: GitHub, Slack, Notion, Jira atď.)
Tool descriptions matter more than you think — Anthropic strávil viac času optimalizáciou nástrojov ako promptov pre svojho SWE-bench agenta
AWS AgentCore Gateway — Konvertuje API a Lambda funkcie na nástroje kompatibilné s agentom, prepája s MCP servermi a umožňuje sémantické objavovanie nástrojov

Pro tip: Navrhujte Agent-Computer Interface (ACI) rovnako starostlivo ako by ste navrhovali Human-Computer Interface (HCI). Ak by junior vývojár nerozumel popisu vášho nástroja, model tiež nie.

Pilier 3: Sandbox a spúšťanie kódu (Bezpečná miestnosť)

Váš agent bude generovať a spúšťať kód. Tento kód bude bude niekedy chybný. Niekedy môže byť nebezpečný. Potrebujete nulový dosah škôd.

Ako to vyzerá v produkcii:

Isolated Docker containers pre každé spustenie bez prístupu k sieti predvolene
Whitelisted commands — len to, čo agent potrebuje
Resource limits — CPU, pamäť, čas, disk
AWS AgentCore Code Interpreter — Bezpečné sandboxované spúšťanie v Pythone, JavaScripte a ďalších
Browser sandboxes — Pre agentov, ktorí potrebujú interagovať s webovými rozhraniami (AgentCore Browser, Playwright)

Anti-vzor: Spúšťanie bash_tool na tom istom serveri ako databáza. Jeden prompt injection a dáta sú preč.

Vzor: Každé spustenie kódu vytvorí dočasný kontajner, ktorý žije a zaniká spolu s úlohou. Agent zapisuje do dočasného súborového systému, výsledky sa extrahujú a kontajner sa zničí.

Pilier 4: Pamäť (Mozog agenta v čase)

Bez pamäti každá konverzácia začína od nuly. Váš agent zabudne meno používateľa, jeho preferencie aj posledných 47 správ od včera.

Pamäť v produkčných agentoch funguje na troch úrovniach:

Úroveň	Rozsah	Príklad
Krátkodobá	Aktuálna konverzácia	História chatu v kontextovom okne
Pracovná	Aktuálna úloha	Súbory, medzivýsledky, stav plánu
Dlhodobá	Medzirelačná	Preferencie používateľa, naučené vzory, AGENTS.md

Kľúčový poznatek od Harrisona Chasea (LangChain): „Pamäť nie je plugin — je to harness.“ To, ako pamäť načítava, kompaktuje, sumarizuje a uchováva dáta, je základnou zodpovednosťou harnessu, nie doplnku.

Čo produkčná pamäť potrebuje:

Sliding window + summarization — Neskracujte len tak, komprimujte inteligentne
Filesystem-backed memory — Vzory AGENTS.md, CLAUDE.md pre trvalý kontext
AWS AgentCore Memory — Spravovaná pamäťová služba udržiavajúca kontext naprieč interakciami s líderskými výsledkami v odvetví
Checkpointing — LangGraphov AsyncPostgresSaver ukladá každý stavový prechod pre obnovu a ladenie

Upozornenie: Ak používate closed-source harness za proprietárnym API, vaša pamäť vám nepatrí. Keď zmeníte model, pamäť zostane za sebou — uzamknutá v cudzej platforme.

Pilier 5: Znalostná báza a RAG (Knižnica agenta)

Pamäť je to, čo sa agent naučil. Znalosti sú to, čo agent môže vyhľadať.

Produkčný RAG vyžaduje:

Vector databases (Qdrant, Pinecone, pgvector) pre sémantické vyhľadávanie
Hybrid search — Kombinujte vektorovú podobnosť s kľúčovými slovami BM25 pre lepší recall
Chunking strategy — Nie všetky dokumenty sú rovnaké. Kód, PDF a markdown potrebujú rôzne prístupy k deleniu
Citation tracking — Používatelia musia dôverovať odpovedam agenta. Číslované citácie [1], [2] inline sú základným štandardom

Bežná chyba: Nahadzovanie všetkého do jedného vektorového indexu v nádeji, že embedding vyhľadávanie to zvládne. Nezvládne. Produkčný RAG potrebuje filtrovanie metadát, re-ranking a zdrojovo-uvedomelé vyhľadávanie.

Pilier 6: Autorizácia a identita (Vyhadzovač)

Kto agenta používa? Čo smie robiť? A čie prihlasovacie údaje agent použije, keď volá Slack?

Existujú dva zásadne odlišné autorizačné modely pre agentov:

On-behalf-of — Agent koná v mene používateľa. Alicin agent vidí Alicine stránky v Notion. Bobov agent vidí Bobove. Agent dedí oprávnenia používateľa.
Agent-as-identity — Agent má vlastné prihlasovacie údaje a oprávnenia nezávisle od toho, kto chatuje. Každý vidí to isté. Predstavte si: verejný support bot.

Produkčný autorizačný stack:

Keycloak / Auth0 / WorkOS — Poskytovateľ identity pre autentifikáciu používateľov (OIDC, JWT)
Workspace-level RBAC — Role Admin, Editor, Člen kontrolujú, kto môže agentov vytvárať a kto ich používať
AWS AgentCore Identity — Spravovaná identita agenta pre bezpečný prístup k AWS zdrojom a nástrojom tretích strán s vopred autorizovaným súhlasom používateľa
Per-tool credential scoping — Agent by nikdy nemal mať širší prístup, ako úloha vyžaduje

Nočná mora: Agent s admin prihlasovacími údajmi vystavený cez chatbot. Jeden chytrý prompt = plný prístup k vašim interným systémom.

Pilier 7: Guardrails a pravidlá (Záchranná sieť)

Guardrails sú obmedzenia, ktoré bránia agentovi urobiť niečo katastrofálne zlé.

Typy guardrails:

Input guardrails — Kontrolujú požiadavky používateľov na prompt injection, jailbreaky, nevhodný obsah skôr ako model ich uvidí
Output guardrails — Validujú odpovede pred doručením používateľovi. Žiadne osobné údaje? Žiadne halucinované URL? Žiadne medicínske/právne rady?
Action guardrails — Nebezpečné volania nástrojov podmieňujú ľudským schválením. Odoslanie e-mailu? Vytvorenie Jira ticketu? Mazanie súboru? Najprv sa opýtajte.
Budget guardrails — Maximálny počet tokenov na požiadavku, max. volania nástrojov na reláciu, mesačné limity výdavkov na agenta

AWS AgentCore Policy zachytáva volania nástrojov v reálnom čase pomocou Cedar politík definovaných v prirodzenom jazyku. „Agent nemôže mazať produkčné databázy“ sa stáva vymáhateľným pravidlom, nie len nádejou.

Kľúčový poznatek Anthropicu: Spúšťajte guardrails ako samostatnú inštanciu modelu paralelne s primárnou odpoveďou. Ak ten istý LLM spracúva odpoveď aj vlastnú bezpečnostnú kontrolu, výsledok je horší ako pri dvoch samostatných volaniach.

Pilier 8: Middleware a hooky (Riadiaca rovina)

Middleware je tmel medzi komponentmi harnessu. Umožňuje injektovať deterministické správanie v konkrétnych bodoch vykonávania agenta bez úpravy hlavnej slučky.

Bežné vzory middlewaru:

Pre-LLM hooks — Injektujú vrstvy systémového promptu, formátujú kontext, aplikujú cachovanie promptov
Post-LLM hooks — Logujú odpovede, vyhodnocujú kvalitu, spúšťajú upozornenia
Pre-tool hooks — Validujú argumenty nástrojov, kontrolujú oprávnenia, rate-limitujú
Post-tool hooks — Parsujú výstupy nástrojov, skracujú veľké odpovede, zapisujú do audit logu
Compaction hooks — Spustia sa pri zaplnení kontextového okna, sumarizujú a pokračujú
Continuation hooks (Ralph Loop) — Zachytávajú pokus modelu o ukončenie a reinjectujú pôvodný prompt pre dlhodobé úlohy

Implementácia v LangGraph: Middleware možno pridať ako hrany grafu, podmienené smerovanie alebo obaly uzlov. Deep Agents má vstavaný middleware systém pre prispôsobenie.

Krása middlewaru: vaša hlavná logika agenta zostáva čistá. Všetky nepríjemné veci — logovanie, rate limiting, filtrovanie obsahu, počítanie tokenov — žijú v kompozitných vrstvách okolo nej.

Pilier 9: Pozorovateľnosť a vyhodnocovanie (Oči)

Ak nevidíte, čo váš agent robí, nemôžete to opraviť. A agenti opravu potrebovať budú.

Produkčná pozorovateľnosť zahŕňa:

Tracing — Úplná cesta vykonávania: každé LLM volanie, každé volanie nástroja, každý stavový prechod. LangSmith, Langfuse a OpenTelemetry sú štandardy.
Token accounting — Prompt tokeny, completion tokeny, celkové náklady na volanie. Rozložte podľa agenta, používateľa a časového obdobia.
Latency tracking — Celkový čas odozvy, latencia per nástroj, čas inferencie LLM
Error rates — Zlyhania nástrojov, chyby LLM, miery timeoutov, prekročenia rate limitov
Evaluation — Automatizované hodnotenia správnosti, podloženosti, relevantnosti. Spúšťajte priebežne, nielen pred nasadením.

AWS AgentCore poskytuje:

Evaluations — Vzorkujte a hodnoťte živé interakcie pomocou vstavaných a vlastných hodnotiteľov
Observability dashboards — Poháňané CloudWatchom s integráciou OpenTelemetry

Poznatek Harrisona Chasea: „Traces sú základ.“ Všetko — priebežné učenie, optimalizácia harnessu, zlepšovanie pamäti — začína kompletnými traces toho, čo váš agent skutočne robil.

Produkčný kontrolný zoznam

Pred nasadením agenta prejdite týmto zoznamom:

TL;DR

Model je inteligencia. Harness z tej inteligencie robí niečo užitočné. A harness má 9 pilierov:

Harness — Orchestračná slučka (LangGraph, Deep Agents)
Tools & MCP — Ako agenti interagujú so svetom
Sandbox — Bezpečné spúšťanie kódu v izolovaných kontajneroch
Memory — Krátkodobá, working, and long-term context
Knowledge Base — RAG s vektorovým vyhľadávaním a citáciami
Authorization — Identita používateľa a oprávnenia agenta
Guardrails — Záchranné siete pre vstup, výstup, akcie a rozpočet
Middleware — Kompozitné hooky pre deterministické riadenie
Observability — Tracing, metriky, vyhodnocovanie

Vynechajte čokoľvek z toho a poučíte sa ťažkou cestou.

Budujete produkčnú platformu pre AI agentov? Pracujeme presne na tomto probléme v [OpenPrime AI](https://openprime.ai) — open platforma pre tvorbu, nasadenie a správu enterprise AI agentov so všetkými 9 piliermi v základe.

Kontaktujte nás

Lukáš Cagarda

Senior DevOps Engineer/AI

Referencie a ďalšie čítanie:

The Anatomy of an Agent Harness — Vivek Trivedy, LangChain (marec 2026)
Building Effective Agents — Anthropic (dec 2024)
Your Harness, Your Memory — Harrison Chase, LangChain (apríl 2026)
Two Different Types of Agent Authorization — Harrison Chase (marec 2026)
Amazon Bedrock AgentCore — AWS (2026)
Continual Learning for AI Agents — Harrison Chase (apríl 2026)

Check other articles

Pozrite si ďalšie články

AI nás nenahradí

Umelá inteligencia (AI) je dnes všade okolo nás. Nie všetci ju však správne chápeme a dokážeme efektívne využiť v praxi. Mnohí sa pýtajú, či sa jej treba obávať – odpoveď je jednoduchá: AI nie je hrozbou, ale nástrojom. A rovnako ako pri každej inej technológii, otázkou je skôr to, ako ju vieme využiť vo svoj prospech.

Viac »

AI bez limitov na AWS

Generatívna AI mení pravidlá hry v podnikaní. Firmy aktívne hľadajú spôsoby, ako integrovať AI asistentov, automatizovať procesy a vytvárať nové produkty.

Viac »

Cookie	Dĺžka trvania	Popis
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

9 pilierov produkčných AI agentov: Čo vám nikto nepovie pred nasadením

Váš demo agent funguje. Váš produkčný agent nebude.

Pilier 1: Agent Harness (Orchestračná vrstva)

Pilier 2: Nástroje a MCP (Ruky agenta)

Pilier 3: Sandbox a spúšťanie kódu (Bezpečná miestnosť)

Pilier 4: Pamäť (Mozog agenta v čase)

Krátkodobá

Aktuálna konverzácia

História chatu v kontextovom okne

Pracovná

Aktuálna úloha

Súbory, medzivýsledky, stav plánu

Dlhodobá

Medzirelačná

Preferencie používateľa, naučené vzory, AGENTS.md