AI rendszerek termelésben · Lecke 04

Megfigyelhetőség

Ha egy ágens elbukik egy feladatot, tudnod kell, miért. A megfigyelhetőség nem a beszélgetés tartalmának olvasásáról szól, hanem az ágens döntési mintáinak méréséről.

Vissza a tananyaghoz


Miért buknak el az ágensek

Anthropic termelési nyomkövetése feltárta, hogy az ágensek elbukásának leggyakoribb okai jól azonosítható mintákba rendeződnek. A rossz keresési lekérdezés, a gyenge forrásválasztás és az eszközhiba a leggyakoribb okok, és ha ezek nem láthatók a rendszer működése közben, a hibák megismétlődnek anélkül, hogy bárki észrevenné a mintát.

A megfigyelhetőség célja nem az, hogy utólag megpróbáljuk kitalálni, mi történt, hanem hogy folyamatosan lássuk, milyen döntéseket hoz az ágens, milyen eszközöket választ, és hol térnek el a várt lépésektől.


Mit mérünk eszközválasztás, lekérdezés minőség, hibaarány, interakciós struktúra Mit nem mérünk a beszélgetés tényleges tartalma, a felhasználó személyes adatai Az ágens döntési mintái és interakciós struktúrái, adatvédelem megőrzésével
A megfigyelhetőség a viselkedést méri, nem a tartalmat, ez őrzi meg a felhasználói adatvédelmet.

Adatvédelem és megfigyelhetőség együtt

Sokan azt feltételezik, hogy egy jól megfigyelt rendszerhez hozzá kell férni a felhasználói beszélgetések tartalmához. Anthropic gyakorlata ennek az ellenkezőjét mutatja. A rendszer az ágens döntési mintáit és interakciós struktúráit figyeli anélkül, hogy a beszélgetés tartalmához hozzáférne, így a felhasználói adatvédelem és a rendszer átláthatósága nem zárja ki egymást.


Eszközhasználat Lépésidő Hibaarány Lekérdezés minőség Forrásválasztás Interakciós minta mindegyik mérőszám a viselkedésről szól, egyik sem a beszélgetés tartalmáról
A megfigyelhetőség rácsa, hat mérőszám, ami a hibakeresést segíti a tartalom megnyitása nélkül.

Mit érdemes bevezetni egy vállalati rendszerben

Egy induló AI ágensrendszernél már az is óriási előrelépés, ha loggoljuk, melyik eszközt mikor hívta meg az ágens, mennyi ideig futott egy lépés, és hol lépett ki hibával. Ezekből az adatokból derül ki, hol érdemes a rendszert finomítani, mielőtt a probléma nagyobb léptékben, sok felhasználónál jelentkezne.


Forrás

Anthropic "How we built our multi-agent research system", "Writing effective tools for AI agents" és a hivatalos Claude Code best practices dokumentáció magyar feldolgozása.


← Előző lecke Következő lecke →

Workshop

AI Transformation Day

Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.

Érdekel a program →