Multi-agent workflowk · Lecke 07

Termelési megbízhatóság

Egy hosszan futó, több ügynökből álló rendszernél a hibák nem kivételek, hanem várható események. A megbízhatóság az állapotkezelésen, a megfigyelhetőségen és a körültekintő verziófrissítésen múlik.

Vissza a tananyaghoz


Állapot fenntartása sok eszközhívás során

Egy komplex kutatási feladat során a rendszer sokszor tíz vagy száz eszközhívást is végrehajt, mire elkészül a végleges válasz. Ha ez idő alatt bármelyik lépés meghibásodik, a rendszernek nem szabad nulláról újrakezdenie a munkát. Ehelyett checkpointokat használnak, vagyis a folyamat közbenső állapotát rendszeresen elmentik, így hiba esetén a legutóbbi mentett ponttól tud folytatódni a feldolgozás.


checkpoint 1 checkpoint 2 hiba történik újraindítás az utolsó checkpointból, nem nulláról kész válasz
Hiba esetén a rendszer a legutóbbi checkpointból folytatja, nem kezdi elölről a munkát.

Megfigyelhetőség beszélgetéstartalom nélkül

Amikor egy ügynök elakad vagy hibázik, fontos megérteni miért, ugyanakkor az adatvédelem miatt a rendszernek nincs hozzáférése a beszélgetés tényleges tartalmához. Ez azt jelenti, hogy a megfigyelhetőségnek olyan jelzésekre kell épülnie, mint az eszközhívások sorrendje, időzítése és eredménye, nem pedig magára a szövegre. Ez a fajta megfigyelhetőség teszi lehetővé a rendszerszintű hibák felderítését anélkül, hogy a felhasználói tartalomba be kellene tekinteni.


Rainbow deployment a futó ágensek védelmére

Amikor egy új verziót vezetnek be, nem lehet egyszerűen egyik pillanatról a másikra lecserélni a régi rendszert, mert az éppen futó, hosszabb ideig tartó ágensfolyamatokat ez megszakítaná. Az úgynevezett "rainbow deployment" megoldás fokozatosan tereli át a forgalmat a régi verzióról az újra, úgy hogy a már elindult munkafolyamatok végig futhatnak a régi verzión, míg az új kérések már az új verziót használják.


RAINBOW DEPLOYMENT, FOKOZATOS ÁTÁLLÁS régi verzió, futó ágensek befejezik új verzió, új kérések ide kerülnek nincs megszakadt ágensfolyamat
A rainbow deployment fokozatosan tereli át a forgalmat, a futó munkafolyamatok nem szakadnak meg.

Forrás

Anthropic "How we built our multi-agent research system" (anthropic.com/engineering/multi-agent-research-system) és "Building Effective AI Agents" (anthropic.com/research/building-effective-agents) című cikkeinek magyar feldolgozása.


← Előző lecke Következő lecke →

Workshop

AI Transformation Day

Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.

Érdekel a program →