9 pilierov produkčných AI agentov: Čo vám nikto nepovie pred nasadením

Váš demo agent funguje. Váš produkčný agent nebude.

AI agenta dokáže postaviť každý za víkend. Hodíte LLM API volanie do slučky, pridáte vyhľadávací nástroj, nasadíte na Vercel. Hotovo. Ideme.

Potom príde realita.

Váš agent halucinuje finančné dáta. Vykoná rm -rf / na vašom serveri. Unikajú mu osobné údaje zákazníkov naprieč hranicami tenantov. Premrhaná $2 000 v tokenoch cez noc, lebo nikto nenastavil limit.

Rozdiel medzi demo agentom a produkčným agentom nie je v kóde — je v infraštruktúre. A v roku 2026 má táto infraštruktúra meno: Agent Harness.

„Agent = Model + Harness. Ak nie si model, si harness.“
— Vivek Trivedy, LangChain

 

Tento článok rozoberá 9 základných pilierov, ktoré každý produkčný AI agent potrebuje. Žiadne klišé. Žiadne „záleží od situácie.“ Len konkrétne stavebné bloky — overené v praxi spoločnosťami ako AWS, Anthropic, LangChain a open-source komunitou.

kubernetes,optimalizácia prevádzky,finops

Pilier 1: Agent Harness (Orchestračná vrstva)

Harness je všetko, čo nie je model. Je to while-slučka, stavový automat, if tool_call then execute logika. P Premení jednoduché bezstavové API na inteligentný uvažovací nástroj.

Čo robí:

  • Spravuje ReAct slučku agenta (Uvažuj → Konaj → Pozoruj → Opakuj)
  • Smeruje medzi uzlami stavového grafu (LangGraph, AWS Step Functions)
  • Spravuje kontextové okno, kompakciu a pokračovanie
  • Riadi výber nástrojov a poradie ich vykonávania

 

Kľúčové technológie:

  • LangGraph — Stavové, cyklické spúšťanie grafov s vstavaným checkpointingom. Skompiluje agenta raz pri štarte, nástroje a LLM vkladá pri volaní. Používaný v produkcii Linkedinom, Uberom a 400+ spoločnosťami.
  • AWS Bedrock AgentCore Runtime — Serverless nasadenie agentov s izoláciou relácií, podporujúce všetko od konverzácií s nízkou latenciou až po 8-hodinové asynchrónne záťaže.
  • Deep Agents (LangChain) — Open-source, model-agnostický harness so súborovým systémom, plánovaním, subagentmi a middlewarom v základe.

 

Zlaté pravidlo: Začnite jednoducho. Vlastné odporúčanie Anthropicu: „Nájdite čo najjednoduchšie riešenie a náročnosť zvyšujte len vtedy, keď je to potrebné.“ Väčšina produkčných agentov je ReAct slučka — nie 47-uzlový orchestračný graf.

Pilier 2: Nástroje a MCP (Ruky agenta)

Model bez nástrojov je filozof. Myslí krásne, ale nedokáže nič urobiť.

Nástroje sú spôsob, akým agenti komunikujú s vonkajším svetom — vyhľadávajú na webe, čítajú databázy, posielajú e-maily, vytvárajú dokumenty. A v roku 2026 Model Context Protocol (MCP) sa stal univerzálnym štandardom na prepojenie agentov s nástrojmi.

Čo produkčné systémy nástrojov potrebujú:

  • Dynamic assembly — Nástroje nasadené na každú požiadavku podľa konfigurácie agenta, nie zabudované v grafe
  • MCP servers — Štandardizovaný protokol pre objavovanie a spúšťanie nástrojov (40+ predpripravených: GitHub, Slack, Notion, Jira atď.)
  • Tool descriptions matter more than you think — Anthropic strávil viac času optimalizáciou nástrojov ako promptov pre svojho SWE-bench agenta
  • AWS AgentCore Gateway — Konvertuje API a Lambda funkcie na nástroje kompatibilné s agentom, prepája s MCP servermi a umožňuje sémantické objavovanie nástrojov

Pro tip: Navrhujte Agent-Computer Interface (ACI) rovnako starostlivo ako by ste navrhovali Human-Computer Interface (HCI). Ak by junior vývojár nerozumel popisu vášho nástroja, model tiež nie.

kubernetes,optimalizácia prevádzky,finops

Pilier 3: Sandbox a spúšťanie kódu (Bezpečná miestnosť)

Váš agent bude generovať a spúšťať kód. Tento kód bude bude niekedy chybný. Niekedy môže byť nebezpečný. Potrebujete nulový dosah škôd.

 

Ako to vyzerá v produkcii:

  • Isolated Docker containers pre každé spustenie bez prístupu k sieti predvolene
  • Whitelisted commands — len to, čo agent potrebuje
  • Resource limits — CPU, pamäť, čas, disk
  • AWS AgentCore Code Interpreter — Bezpečné sandboxované spúšťanie v Pythone, JavaScripte a ďalších
  • Browser sandboxes — Pre agentov, ktorí potrebujú interagovať s webovými rozhraniami (AgentCore Browser, Playwright)

 

Anti-vzor: Spúšťanie bash_tool na tom istom serveri ako databáza. Jeden prompt injection a dáta sú preč.

Vzor: Každé spustenie kódu vytvorí dočasný kontajner, ktorý žije a zaniká spolu s úlohou. Agent zapisuje do dočasného súborového systému, výsledky sa extrahujú a kontajner sa zničí.

Pilier 4: Pamäť (Mozog agenta v čase)

Bez pamäti každá konverzácia začína od nuly. Váš agent zabudne meno používateľa, jeho preferencie aj posledných 47 správ od včera.

 

Pamäť v produkčných agentoch funguje na troch úrovniach:

Úroveň Rozsah Príklad
Krátkodobá
Aktuálna konverzácia
História chatu v kontextovom okne
Pracovná
Aktuálna úloha
Súbory, medzivýsledky, stav plánu
Dlhodobá
Medzirelačná
Preferencie používateľa, naučené vzory, AGENTS.md

Kľúčový poznatek od Harrisona Chasea (LangChain): „Pamäť nie je plugin — je to harness.“ To, ako pamäť načítava, kompaktuje, sumarizuje a uchováva dáta, je základnou zodpovednosťou harnessu, nie doplnku.

 

Čo produkčná pamäť potrebuje:

  • Sliding window + summarization — Neskracujte len tak, komprimujte inteligentne
  • Filesystem-backed memory — Vzory AGENTS.md, CLAUDE.md pre trvalý kontext
  • AWS AgentCore Memory — Spravovaná pamäťová služba udržiavajúca kontext naprieč interakciami s líderskými výsledkami v odvetví
  • Checkpointing — LangGraphov AsyncPostgresSaver ukladá každý stavový prechod pre obnovu a ladenie

 

Upozornenie: Ak používate closed-source harness za proprietárnym API, vaša pamäť vám nepatrí. Keď zmeníte model, pamäť zostane za sebou — uzamknutá v cudzej platforme.

Pilier 5: Znalostná báza a RAG (Knižnica agenta)

Pamäť je to, čo sa agent naučil. Znalosti sú to, čo agent môže vyhľadať.

 

Produkčný RAG vyžaduje:

  • Vector databases (Qdrant, Pinecone, pgvector) pre sémantické vyhľadávanie
  • Hybrid search — Kombinujte vektorovú podobnosť s kľúčovými slovami BM25 pre lepší recall
  • Chunking strategy — Nie všetky dokumenty sú rovnaké. Kód, PDF a markdown potrebujú rôzne prístupy k deleniu
  • Citation tracking — Používatelia musia dôverovať odpovedam agenta. Číslované citácie [1], [2] inline sú základným štandardom

 

Bežná chyba: Nahadzovanie všetkého do jedného vektorového indexu v nádeji, že embedding vyhľadávanie to zvládne. Nezvládne. Produkčný RAG potrebuje filtrovanie metadát, re-ranking a zdrojovo-uvedomelé vyhľadávanie.

kubernetes,optimalizácia prevádzky,finops

Pilier 6: Autorizácia a identita (Vyhadzovač)

Kto agenta používa? Čo smie robiť? A čie prihlasovacie údaje agent použije, keď volá Slack?

 

Existujú dva zásadne odlišné autorizačné modely pre agentov:

  1. On-behalf-of — Agent koná v mene používateľa. Alicin agent vidí Alicine stránky v Notion. Bobov agent vidí Bobove. Agent dedí oprávnenia používateľa.
  2. Agent-as-identity — Agent má vlastné prihlasovacie údaje a oprávnenia nezávisle od toho, kto chatuje. Každý vidí to isté. Predstavte si: verejný support bot.

 

Produkčný autorizačný stack:

  • Keycloak / Auth0 / WorkOS — Poskytovateľ identity pre autentifikáciu používateľov (OIDC, JWT)
  • Workspace-level RBAC — Role Admin, Editor, Člen kontrolujú, kto môže agentov vytvárať a kto ich používať
  • AWS AgentCore Identity — Spravovaná identita agenta pre bezpečný prístup k AWS zdrojom a nástrojom tretích strán s vopred autorizovaným súhlasom používateľa
  • Per-tool credential scoping — Agent by nikdy nemal mať širší prístup, ako úloha vyžaduje

 

Nočná mora: Agent s admin prihlasovacími údajmi vystavený cez chatbot. Jeden chytrý prompt = plný prístup k vašim interným systémom.

 

Pilier 7: Guardrails a pravidlá (Záchranná sieť)

Guardrails sú obmedzenia, ktoré bránia agentovi urobiť niečo katastrofálne zlé.

 

Typy guardrails:

  • Input guardrails — Kontrolujú požiadavky používateľov na prompt injection, jailbreaky, nevhodný obsah skôr ako model ich uvidí
  • Output guardrails — Validujú odpovede pred doručením používateľovi. Žiadne osobné údaje? Žiadne halucinované URL? Žiadne medicínske/právne rady?
  • Action guardrails — Nebezpečné volania nástrojov podmieňujú ľudským schválením. Odoslanie e-mailu? Vytvorenie Jira ticketu? Mazanie súboru? Najprv sa opýtajte.
  • Budget guardrails — Maximálny počet tokenov na požiadavku, max. volania nástrojov na reláciu, mesačné limity výdavkov na agenta

 

AWS AgentCore Policy zachytáva volania nástrojov v reálnom čase pomocou Cedar politík definovaných v prirodzenom jazyku. „Agent nemôže mazať produkčné databázy“ sa stáva vymáhateľným pravidlom, nie len nádejou.

 

Kľúčový poznatek Anthropicu: Spúšťajte guardrails ako samostatnú inštanciu modelu paralelne s primárnou odpoveďou. Ak ten istý LLM spracúva odpoveď aj vlastnú bezpečnostnú kontrolu, výsledok je horší ako pri dvoch samostatných volaniach.

Pilier 8: Middleware a hooky (Riadiaca rovina)

Middleware je tmel medzi komponentmi harnessu. Umožňuje injektovať deterministické správanie v konkrétnych bodoch vykonávania agenta bez úpravy hlavnej slučky.

 

Bežné vzory middlewaru:

  • Pre-LLM hooks — Injektujú vrstvy systémového promptu, formátujú kontext, aplikujú cachovanie promptov
  • Post-LLM hooks — Logujú odpovede, vyhodnocujú kvalitu, spúšťajú upozornenia
  • Pre-tool hooks — Validujú argumenty nástrojov, kontrolujú oprávnenia, rate-limitujú
  • Post-tool hooks — Parsujú výstupy nástrojov, skracujú veľké odpovede, zapisujú do audit logu
  • Compaction hooks — Spustia sa pri zaplnení kontextového okna, sumarizujú a pokračujú
  • Continuation hooks (Ralph Loop) — Zachytávajú pokus modelu o ukončenie a reinjectujú pôvodný prompt pre dlhodobé úlohy

 

Implementácia v LangGraph: Middleware možno pridať ako hrany grafu, podmienené smerovanie alebo obaly uzlov. Deep Agents má vstavaný middleware systém pre prispôsobenie.

 

Krása middlewaru: vaša hlavná logika agenta zostáva čistá. Všetky nepríjemné veci — logovanie, rate limiting, filtrovanie obsahu, počítanie tokenov — žijú v kompozitných vrstvách okolo nej.

middleware flow

Pilier 9: Pozorovateľnosť a vyhodnocovanie (Oči)

Ak nevidíte, čo váš agent robí, nemôžete to opraviť. A agenti opravu potrebovať budú.

 

Produkčná pozorovateľnosť zahŕňa:

  • Tracing — Úplná cesta vykonávania: každé LLM volanie, každé volanie nástroja, každý stavový prechod. LangSmith, Langfuse a OpenTelemetry sú štandardy.
  • Token accounting — Prompt tokeny, completion tokeny, celkové náklady na volanie. Rozložte podľa agenta, používateľa a časového obdobia.
  • Latency tracking — Celkový čas odozvy, latencia per nástroj, čas inferencie LLM
  • Error rates — Zlyhania nástrojov, chyby LLM, miery timeoutov, prekročenia rate limitov
  • Evaluation — Automatizované hodnotenia správnosti, podloženosti, relevantnosti. Spúšťajte priebežne, nielen pred nasadením.

 

AWS AgentCore poskytuje:

  • Evaluations — Vzorkujte a hodnoťte živé interakcie pomocou vstavaných a vlastných hodnotiteľov
  • Observability dashboards — Poháňané CloudWatchom s integráciou OpenTelemetry

 

Poznatek Harrisona Chasea: „Traces sú základ.“ Všetko — priebežné učenie, optimalizácia harnessu, zlepšovanie pamäti — začína kompletnými traces toho, čo váš agent skutočne robil.

Produkčný kontrolný zoznam

Pred nasadením agenta prejdite týmto zoznamom:

kubernetes,optimalizácia prevádzky,finops

TL;DR

Model je inteligencia. Harness z tej inteligencie robí niečo užitočné. A harness má 9 pilierov:

 

  1. Harness — Orchestračná slučka (LangGraph, Deep Agents)
  2. Tools & MCP — Ako agenti interagujú so svetom
  3. Sandbox — Bezpečné spúšťanie kódu v izolovaných kontajneroch
  4. Memory — Krátkodobá, working, and long-term context
  5. Knowledge Base — RAG s vektorovým vyhľadávaním a citáciami
  6. Authorization — Identita používateľa a oprávnenia agenta
  7. Guardrails — Záchranné siete pre vstup, výstup, akcie a rozpočet
  8. Middleware — Kompozitné hooky pre deterministické riadenie
  9. Observability — Tracing, metriky, vyhodnocovanie

 

Vynechajte čokoľvek z toho a poučíte sa ťažkou cestou.

 

Budujete produkčnú platformu pre AI agentov? Pracujeme presne na tomto probléme v [OpenPrime AI](https://openprime.ai) — open platforma pre tvorbu, nasadenie a správu enterprise AI agentov so všetkými 9 piliermi v základe.

 

Picture of Lukáš Cagarda

Lukáš Cagarda

Senior DevOps Engineer/AI

Referencie a ďalšie čítanie:

  • The Anatomy of an Agent Harness — Vivek Trivedy, LangChain (marec 2026)
  • Building Effective Agents — Anthropic (dec 2024)
  • Your Harness, Your Memory — Harrison Chase, LangChain (apríl 2026)
  • Two Different Types of Agent Authorization — Harrison Chase (marec 2026)
  • Amazon Bedrock AgentCore — AWS (2026)
  • Continual Learning for AI Agents — Harrison Chase (apríl 2026)

Check other articles

Pozrite si ďalšie články

ai,nahradí,aws

AI nás nenahradí

Umelá inteligencia (AI) je dnes všade okolo nás. Nie všetci ju však správne chápeme a dokážeme efektívne využiť v praxi. Mnohí sa pýtajú, či sa jej treba obávať – odpoveď je jednoduchá: AI nie je hrozbou, ale nástrojom. A rovnako ako pri každej inej technológii, otázkou je skôr to, ako ju vieme využiť vo svoj prospech.

Viac »
AI bez limitov na AWS,AWS prístup,AI Agenti

AI bez limitov na AWS

Generatívna AI mení pravidlá hry v podnikaní. Firmy aktívne hľadajú spôsoby, ako integrovať AI asistentov, automatizovať procesy a vytvárať nové produkty.

Viac »