Rendszerpromptok a megfelelő szinten

Két hibás véglet

A rendszerpromptok írásánál két gyakori hiba fordul elő. Az egyik véglet a túlságosan specifikus prompt, ami minden lehetséges esetre külön szabályt próbál lefektetni. Ez törékeny if-else logikákhoz vezet, amik az első váratlan helyzetben megbicsaklanak, és karbantarthatatlanná válnak.

A másik véglet a túlságosan homályos prompt, ami általános elveket sorol fel konkrét iránymutatás nélkül. Ilyenkor a modellnek nincs elég jelzése ahhoz, hogy eldöntse, mit várunk tőle egy adott helyzetben, így kiszámíthatatlanul viselkedik.

A jó rendszerprompt a két véglet közötti keskeny zónában található.

Strukturálás és tesztelés

A rendszerpromptot érdemes világos struktúrába rendezni, például XML tagekkel vagy Markdown fejlécekkel, hogy a modell könnyen elkülönítse egymástól a különböző típusú információkat, mint a háttér, az instrukciók, vagy az eszközhasználati útmutatás.

A rendszerpromptot mindig a legjobb elérhető modellel érdemes tesztelni, és a valós hibamódok alapján fokozatosan bővíteni. Ez azt jelenti, hogy nem elméleti esetekre írunk szabályokat, hanem a ténylegesen megfigyelt hibás viselkedésekre reagálunk, célzottan és takarékosan.

Miért nem egyszeri feladat ez sem

A rendszerprompt írása ugyanúgy iteratív folyamat, mint a context engineering egésze. Ahogy az ágens új helyzetekbe kerül, új hibamódok merülnek fel, amiket vissza kell vezetni a promptba, de mindig a legkisebb szükséges kiegészítéssel, nem egy újabb kivétel hozzáadásával a végtelenségig.

Az XML tagek és Markdown fejlécek egyértelműen elkülönítik a rendszerprompt részeit.

Forrás

Anthropic "Effective context engineering for AI agents" és "Demystifying evals for AI agents" című cikkeinek magyar feldolgozása.

← Előző lecke Következő lecke →

Workshop

AI Transformation Day

Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.

Érdekel a program →