Multi-agent workflowk · Lecke 05

Prompt engineering többügynökös rendszerekben

A több ügynökből álló rendszerek fejlesztése iteratív folyamat, amelyben a hibamódok azonosítása és a promptok finomítása legalább annyira fontos, mint maga az architektúra.

Vissza a tananyaghoz


Hibamódok azonosítása szimulációkkal

Az Anthropic csapata a Console környezetben futtatott szimulációk segítségével azonosította, hol viselkedik a rendszer másképp, mint elvárnák. Ez a módszer lehetővé tette, hogy még a valós felhasználók elé kerülés előtt felszínre kerüljenek azok a mintázatok, amelyek felesleges munkához, hibás delegáláshoz vagy pontatlan válaszokhoz vezettek.


Korai hibák, amikből tanultak

Az egyik jellemző korai hiba az volt, hogy a rendszer egy egyszerű kérdésre akár 50 subagentet is indított, jóval többet, mint amennyi indokolt lett volna. Egy másik hiba a szekvenciális keresés volt, amikor a subagentek egymás után, nem pedig párhuzamosan futottak, feleslegesen megnövelve a teljes futásidőt. Ezeket a mintázatokat csak úgy lehetett kijavítani, hogy explicit szabályokat írtak a lead agent promptjába.


Korai hiba 50 subagent egy egyszerű kérdésre, szekvenciális keresések Javítás explicit szabályokkal skálázási szabályok, tiszta eszközleírások, párhuzamos hívás előírása
A hibamódok szimulációkkal való feltárása vezetett az explicit promptszabályokhoz.

A tiszta eszközleírás és a párhuzamosítás előírása

Két konkrét javítás bizonyult különösen hatásosnak. Az egyik a tiszta, félreérthetetlen eszközleírás, amely pontosan megmondja a subagentnek, mikor melyik eszközt érdemes használnia. A másik annak explicit előírása, hogy a subagent párhuzamosan hívja meg az egymástól független eszközöket ahelyett, hogy egyesével, szekvenciálisan futtatná őket. Emellett az extended thinking mint vezérelhető jegyzettömb is segített abban, hogy az ügynök gondolatmenete követhető és javítható legyen.


A gondos promptolás mérhető eredménye

A Claude Opus 4 lead ügynökből és Claude Sonnet 4 subagentekből álló rendszer belső kiértékeléseken 90.2%-kal jobban teljesített, mint egy egyágenses Claude Opus 4. Ugyanakkor ennek ára is van, a token-felhasználás önmagában a teljesítménybeli eltérések (variancia) 80%-át magyarázza, egy ügynök körülbelül négyszer annyi tokent használ mint egy sima chat beszélgetés, egy teljes multi-agent rendszer pedig körülbelül tizenötször annyit.


100% egyágenses Opus 4 190.2% multi-agent rendszer 1x token sima chat ~15x token multi-agent rendszer
Jobb eredmény, de jóval nagyobb token-felhasználás mellett, ezért csak ott éri meg, ahol az érték ezt indokolja.

Forrás

Anthropic "How we built our multi-agent research system" (anthropic.com/engineering/multi-agent-research-system) és "Building Effective AI Agents" (anthropic.com/research/building-effective-agents) című cikkeinek magyar feldolgozása.


← Előző lecke Következő lecke →

Workshop

AI Transformation Day

Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.

Érdekel a program →