Context engineering és evalok · Lecke 04

Eszköztervezés és példák

Ha egy mérnök nem tudja eldönteni, melyik eszközt kell használni egy adott helyzetben, az ágens sem fogja tudni. A jó eszköztervezés és a jól válogatott példák sokkal többet érnek, mint a kimerítő dokumentáció.

Vissza a tananyaghoz


Milyen egy jó eszköz

Az ágensi rendszerekben az eszközök jelentik a modell és a külvilág közötti interfészt. A jó eszköz önmagában zárt, tehát nem igényel más eszközök ismeretét a helyes használatához. Hibatűrő, tehát váratlan bemenetre sem omlik össze értelmetlenül. Egyértelmű rendeltetésű, és minimális az átfedése más eszközökkel.

Ha egy tapasztalt mérnök is bizonytalan abban, hogy két hasonló eszköz közül melyiket kellene használnia egy adott helyzetben, az AI ágens is bizonytalan lesz, és rosszul fog dönteni. Az eszközök közti egyértelmű határvonal ezért nem apró részlet, hanem alapvető tervezési szempont.


Jó eszközkészlet keresés létrehozás törlés, minimális átfedés Rossz eszközkészlet keres_1 (átfedő) keres_2 (átfedő) homályos, sok kivétel
A jó eszközkészlet elemei egyértelműen elkülönülnek, a rossz eszközkészlet átfedésekkel kényszeríti ki a találgatást.

Token hatékony visszatérési értékek

Az eszközök válaszai közvetlenül a kontextusablakba kerülnek, így ezek is fogyasztják a figyelem büdzsét. Egy jól tervezett eszköz tömören, a feladat szempontjából releváns információra szorítkozva ad választ, nem önti ki a teljes nyers adatot, ha arra nincs szükség.


Miért ér egy példa ezer szót

A modell számára egy jól megválasztott, konkrét példa gyakran hatékonyabb tanítóeszköz, mint egy hosszú szabálylista. Ahelyett, hogy minden lehetséges él-esetet külön dokumentálnánk, érdemes diverz, kanonikus példákat kurálni, amik hatékonyan bemutatják az elvárt viselkedést. Ez a few-shot megközelítés jelentősen csökkenti a szükséges instrukció hosszát, miközben pontosabb irányt ad a modellnek.


Minden él-eset dokumentálása hosszú szabálylista nehezen karbantartható sok tokent fogyaszt mégis hézagos marad Diverz, kanonikus példák 2-3 jól válogatott eset tömör, pontos jelzés egy példa ezer szót ér
A kanonikus példák sokkal kevesebb tokenből adnak erősebb iránymutatást, mint a kimerítő szabálylista.

Forrás

Anthropic "Effective context engineering for AI agents" és "Demystifying evals for AI agents" című cikkeinek magyar feldolgozása.


← Előző lecke Következő lecke →

Workshop

AI Transformation Day

Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.

Érdekel a program →