Kalmár Dániel · AI Governance

Az egységes AI ügynök governance csapdája

Az elmúlt fél évben egyre több vállalatnál futottam bele ugyanabba a mintázatba. Az AI ügynökökre ráhúzzák ugyanazt a szabályrendszert, amit egy egyszerű chatbotra is használnának, aztán csodálkoznak, amikor az első komolyabb incidens után az egész programot leállítják. Ez a cikk arról szól, miért vezet ez a hozzáállás bukáshoz, és mit tapasztaltam olyan szervezeteknél, ahol mégis működött a bevezetés.

Kalmár Dániel · Összes cikk


A jelenség

Amikor egy szabály mindenre vonatkozik, valójában semmire sem vonatkozik jól

Az egyik logisztikai ügyfelemnél tavasszal vezettük be az első AI ügynököket. A csapat lelkes volt, két hónap alatt hét különböző ügynököt raktak élesbe. Volt köztük egy, amelyik a beérkező számlákat kategorizálta, egy másik, amelyik a raktárkészlet riportokat állította össze, és egy harmadik, amelyik önállóan tudott rendeléseket módosítani a partnerek felé. A vezetőség ugyanazt az egy oldalas jóváhagyási folyamatot írta elő mind a hétre. Ugyanaz a felügyeleti szint, ugyanaz a naplózási elvárás, ugyanaz a heti ellenőrzés.

Ami elsőre praktikusnak tűnt, három hónap alatt komoly problémává vált. A számlakategorizáló ügynököt túlszabályozták, minden apró döntéshez emberi jóváhagyást kért, így senki nem használta, inkább kézzel dolgoztak tovább. A rendelésmódosító ügynököt viszont alulszabályozták, mert ugyanaz a könnyű felügyelet vonatkozott rá, mint a kategorizálóra, pedig ez utóbbi valódi pénzügyi kockázattal járt. Amikor egy hibás készletadat miatt téves rendelésmódosítást hajtott végre egy nagyobb partner felé, a vezetőség az egész programot leállította, beleértve azt a két ügynököt is, amelyik kifogástalanul működött.

Ez a mintázat nem egyedi eset. A Gartner idén májusban tette közzé azt az elemzést, amely szerint az egységes governance alkalmazása minden AI ügynökre autonómiaszinttől és hozzáférési körtől függetlenül egyenesen vezet az ügynökök bukásához. A cég azt is előrejelezte, hogy 2027-re a vállalatok negyven százaléka fog visszaminősíteni vagy leállítani autonóm AI ügynököket, méghozzá olyan governance hiányosságok miatt, amelyek csak egy éles incidens után derülnek ki.


A gyökér

Miért nem ugyanaz egy összefoglaló ügynök és egy tranzakciós ügynök

Azt tapasztaltam, hogy a legtöbb vezető az AI ügynököket egyetlen kategóriaként kezeli a fejében, holott a kockázati profiljuk gyökeresen eltér. Egy pénzügyi holding kontrolling csapatánál dolgoztunk együtt egy projekten, ahol pontosan ez volt a kiindulási probléma. Volt egy ügynökük, amelyik havi zárás után szöveges összefoglalót írt a vezetőségnek a legfontosabb eltérésekről. És volt egy másik, amelyik a beszállítói számlák kifizetését indította el automatikusan, ha azok megfeleltek bizonyos feltételeknek.

A két ügynök között két dimenzió mentén van érdemi különbség. Az egyik az autonómia mértéke, vagyis hogy az ügynök csak javasol, vagy önállóan cselekszik is. A másik a hozzáférés hatóköre, vagyis hogy milyen rendszerekhez és adatokhoz nyúl hozzá, és milyen visszafordíthatatlan műveleteket tud elvégezni. Az összefoglaló ügynöknél a legrosszabb eset egy pontatlan mondat, amit a vezető úgyis átolvas. A kifizetést indító ügynöknél a legrosszabb eset egy valós pénzmozgás, ami akár órák alatt jelentős kárt okozhat, mire bárki észreveszi.

Amikor ezt a két dimenziót egymás mellé rakjuk, kirajzolódik egy egyszerű mátrix. Alacsony autonómia és szűk hozzáférés esetén elég a könnyű felügyelet, akár utólagos mintavételes ellenőrzéssel is. Magas autonómia és tág hozzáférés esetén viszont valós idejű monitorozás, jóváhagyási kapu és egyértelmű vészleállítási mechanizmus szükséges. A hiba nem az, hogy a vállalatok nem gondolnak a kockázatra, hanem hogy egyetlen szabálykönyvet próbálnak írni minden esetre, ahelyett hogy szintezett keretben gondolkodnának.


A látótér probléma

A legtöbb szervezet nem is látja, hány ügynöke fut valójában

Egy friss felmérés szerint a szervezeteknek mindössze negyed része rendelkezik teljes rálátással arra, hogy az AI ügynökei egymással hogyan kommunikálnak, és az ügynökök több mint fele biztonsági felügyelet vagy naplózás nélkül fut. Ez pontosan egybevág azzal, amit a saját projektjeimben is látok. Amikor egy kreatív ügynökségnél, ahol 35 fő dolgozik, elkezdtük feltérképezni a használt AI eszközöket, kilenc különböző ügynök típusú megoldás került elő, amiből a vezetés előzőleg négyről tudott. Ez a látótér hiány önmagában is governance kudarc, méghozzá a technikai kockázat előtt. Ha egy szervezet nem tudja felsorolni, hány ügynöke van, milyen jogosultsággal, és mihez fér hozzá, akkor bármilyen szabályzatot is ír, az papíron marad. Az első lépés minden projektemben nem a szabályok megírása, hanem egy egyszerű leltár összeállítása. Melyik ügynök fut, ki üzemelteti, milyen rendszerekhez van hozzáférése, és mi történik, ha rossz döntést hoz.

Az egyik ügyfelemnél ez a leltár önmagában meglepetést okozott a vezetőségnek. Kiderült, hogy két részleg egymástól függetlenül vezetett be hasonló funkciójú ügynököt, és egyik sem tudott a másikról. Az egyik verzió éles ügyféladatokhoz fért hozzá naplózás nélkül, a másik szigorúan tesztkörnyezetben futott. Ha ezt a leltárt nem készítjük el, a governance keret, amit utána megírunk, vakfoltokra épül.

A leltár nehezebb feladat, mint elsőre tűnik, mert az ügynökök jelentős része nem a hivatalos IT csatornán keresztül kerül be a szervezetbe. Azt tapasztaltam, hogy egy-egy lelkes középvezető gyakran maga épít magának automatizált folyamatot valamelyik no-code platformon, anélkül hogy ezt bárkinek jelentené. Egy 400 fős logisztikai cégnél a beszerzési csapat egy tagja saját kezűleg állított össze egy ügynököt, amelyik automatikusan válaszolt a beszállítói e-mailekre, és hetekig senki más nem tudott róla. Az ilyen árnyékban futó ügynökök éppen azért veszélyesek, mert a hivatalos leltárból is hiányoznak, tehát a governance keret rájuk eleve nem is vonatkozhat, amíg fel nem derülnek.


A működő megközelítés

Szintezett felügyelet archetípusok szerint

A BCG idei elemzése azt a megközelítést javasolja, hogy a vállalatok ne egyetlen szabályrendszert írjanak, hanem archetípusokba sorolják az ügynököket, és minden archetípushoz külön felügyeleti szintet, jóváhagyási folyamatot és monitorozási elvárást rendeljenek. Ez pontosan az a szemlélet, amit a saját munkám során is kialakítottam, függetlenül attól, hogy ismertem-e ezt a konkrét anyagot vagy sem. A gyakorlatban három szintet szoktam javasolni.

Az első szintbe azok az ügynökök tartoznak, amelyek javaslatot tesznek, de nem cselekszenek önállóan. Ide tartozik a már említett összefoglaló ügynök, vagy egy olyan, amelyik e-mail tervezeteket ír. Ezeknél elég a mintavételes ellenőrzés, és a felelősség végig az emberi felhasználónál marad, hiszen ő dönt a végleges kimenetről.

A második szintbe kerülnek azok, amelyek szűk, jól körülhatárolt cselekvést hajtanak végre, de a hatókör korlátozott és a művelet visszafordítható. Ilyen egy naptáregyeztető ügynök, vagy egy olyan, amelyik belső dokumentumokat rendez kategóriákba. Itt már indokolt a rendszeres, de nem valós idejű felülvizsgálat, és egy egyszerű napi vagy heti riport arról, mit csinált az ügynök.

A harmadik szintbe tartoznak azok, amelyek valós, visszafordíthatatlan hatással bíró műveleteket végeznek önállóan, mint a fizetés indítás, az ügyféladat módosítás vagy a külső kommunikáció. Ezeknél valós idejű monitorozás, egyértelmű jóváhagyási kapu bizonyos küszöbérték felett, és egy azonnal elérhető vészleállítási mechanizmus szükséges. Amikor egy gyártó cégnél bevezettük ezt a hármas felosztást, az első felmérés kimutatta, hogy a hét futó ügynökből négy valójában az első szintbe tartozott volna, mégis a legszigorúbb szabályokat kellett betartaniuk. Ennek a feloldása után a csapat végre elkezdte használni őket.

Amit minden projektemben elsőként végzek el. Leltár az összes futó vagy tervezett AI ügynökről, majd besorolás autonómia és hozzáférési kör szerint egy egyszerű háromszintű keretbe. Csak ez után érdemes felügyeleti folyamatot és jóváhagyási szabályokat írni, mert enélkül a szabályzat vagy túlszabályoz, vagy vakfoltot hagy.

A felelősségi kérdés

Ki a tulajdonosa egy AI ügynöknek a szervezetben?

Az egyik legnagyobb tanulság, amit ebből a témából szűrtem le, hogy a governance kudarcok jelentős része nem technikai, hanem szervezeti eredetű. Egy nemrég publikált kutatás azt találta, hogy a megkérdezett vállalatok alig több mint negyven százalékánál van egyértelműen kijelölt központi felelős az AI governance-ért, közel negyed részük pedig egyáltalán nem tudta megmondani, ki felel érte. Ez a bizonytalanság az, ami miatt egy incidens után a leggyorsabb és legkényelmesebb reakció a teljes leállítás, mert senki sem tudja pontosan, hol volt a hiba és ki javíthatja ki.

Azt szoktam javasolni, hogy minden ügynöknek legyen egyetlen néven nevezhető üzleti tulajdonosa, aki nem feltétlenül az IT osztályról kerül ki. Ha egy ügynök a kontrolling folyamatba nyúl bele, a tulajdonos legyen a kontrolling vezető, még akkor is, ha a technikai üzemeltetést az IT végzi. Ez a felosztás azért fontos, mert az üzleti tulajdonos ismeri a folyamat kockázatát, míg a technikai üzemeltető a rendszer működését. A kettő együtt ad teljes képet, külön külön egyik sem elég.

Amikor ezt a modellt bevezettük az egyik ügyfelemnél, az első hónapban kiderült, hogy három ügynöknek gyakorlatilag nem volt gazdája, csak annak idején valaki elindította őket egy projekt keretében, és azóta senki sem foglalkozott velük aktívan. Ezeket vagy leállítottuk, vagy hivatalosan is gazdát rendeltünk hozzájuk. Ez az egyszerű lépés önmagában csökkentette a kockázatot, még mielőtt bármilyen technikai kontrollt bevezettünk volna.


Következő lépés

Hol érdemes elkezdeni, ha a szervezet még a felmérésnél tart

Ha a szervezetében már fut néhány AI ügynök, de nincs egységes kép arról, hány van, ki üzemelteti és mihez férnek hozzá, az első lépés nem egy hosszú szabályzat megírása. Egy egyszerű táblázat is elég kezdésnek, amiben soronként szerepel az ügynök neve, a felelőse, a hozzáférési köre és az, hogy önállóan cselekszik e, vagy csak javaslatot tesz. Ebből a táblázatból már kirajzolódik, melyik ügynöknél sürgős a felügyelet szigorítása, és melyiknél lehet lazítani a felesleges jóváhagyási lépéseken.

A cikkben említett szintezett megközelítés részletesebb kidolgozásáról, illetve a vállalati AI policy kapcsolódó kérdéseiről bővebben is olvashat a vállalati AI policy megírásáról szóló cikkemben.

Kérdése van? Ha a saját szervezetében szeretné feltérképezni, hány AI ügynök fut ma, és milyen felügyeleti szintre lenne szükségük, írjon az [email protected] címre, vagy ismerkedjen meg az AI Transformation Day workshoppal.

Workshop

AI Transformation Day

Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.

Érdekel a program →

Kalmár Dániel
Kalmár Dániel AI Transformation Consultant LinkedIn profil →