Context engineering és evalok · Lecke 03

Rendszerpromptok a megfelelő szinten

A jó rendszerprompt nem törékeny if-else logikák gyűjteménye, és nem is homályos általánosság. A cél a minimális, de elégséges információ megtalálása, ami valóban irányítja a modellt.

Vissza a tananyaghoz


Két hibás véglet

A rendszerpromptok írásánál két gyakori hiba fordul elő. Az egyik véglet a túlságosan specifikus prompt, ami minden lehetséges esetre külön szabályt próbál lefektetni. Ez törékeny if-else logikákhoz vezet, amik az első váratlan helyzetben megbicsaklanak, és karbantarthatatlanná válnak.

A másik véglet a túlságosan homályos prompt, ami általános elveket sorol fel konkrét iránymutatás nélkül. Ilyenkor a modellnek nincs elég jelzése ahhoz, hogy eldöntse, mit várunk tőle egy adott helyzetben, így kiszámíthatatlanul viselkedik.


Túl homályos nincs konkrét jelzés Goldilocks zóna minimális, de elégséges Túl specifikus törékeny if-else logika
A jó rendszerprompt a két véglet közötti keskeny zónában található.

Strukturálás és tesztelés

A rendszerpromptot érdemes világos struktúrába rendezni, például XML tagekkel vagy Markdown fejlécekkel, hogy a modell könnyen elkülönítse egymástól a különböző típusú információkat, mint a háttér, az instrukciók, vagy az eszközhasználati útmutatás.

A rendszerpromptot mindig a legjobb elérhető modellel érdemes tesztelni, és a valós hibamódok alapján fokozatosan bővíteni. Ez azt jelenti, hogy nem elméleti esetekre írunk szabályokat, hanem a ténylegesen megfigyelt hibás viselkedésekre reagálunk, célzottan és takarékosan.


Miért nem egyszeri feladat ez sem

A rendszerprompt írása ugyanúgy iteratív folyamat, mint a context engineering egésze. Ahogy az ágens új helyzetekbe kerül, új hibamódok merülnek fel, amiket vissza kell vezetni a promptba, de mindig a legkisebb szükséges kiegészítéssel, nem egy újabb kivétel hozzáadásával a végtelenségig.


<background_information> háttér, kontextus <instructions> konkrét elvárás ## Tool guidance eszközhasználat tesztelés a legjobb modellel
Az XML tagek és Markdown fejlécek egyértelműen elkülönítik a rendszerprompt részeit.

Forrás

Anthropic "Effective context engineering for AI agents" és "Demystifying evals for AI agents" című cikkeinek magyar feldolgozása.


← Előző lecke Következő lecke →

Workshop

AI Transformation Day

Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.

Érdekel a program →