Hogyan alakul ki egy AI modell jelleme

A jellem szó idézőjelbe kívánkozik

Amikor egy AI modell jelleméről vagy személyiségéről beszélünk, fontos rögtön az elején tisztázni, mire nem gondolunk. Nem gondolunk tudatosságra, érzelmekre vagy önálló akaratra. Egy nyelvi modellnek nincs belső élménye, és nem dönt úgy, hogy ma barátságosabb szeretne lenni. Amit jellemnek nevezünk, az valójában egy következetes viselkedési mintázat, amely a modell tanítása során alakult ki, és amely minden egyes válaszban megjelenik.

Ez a mintázat nagyon is valós hatással van a munkádra. Meghatározza, hogy a modell mennyire tömör vagy bőbeszédű, mennyire hajlandó vitatkozni veled, milyen gyakran utasít el egy kérést, és milyen hangnemet üt meg egy nehéz témában. Ha megérted, honnan ered ez a mintázat, sokkal tudatosabban tudod kiválasztani és használni a különböző AI eszközöket.

Az első szakasz, előtanítás

Minden nagy nyelvi modell élete egy úgynevezett előtanítási szakasszal kezdődik. Ebben a fázisban a modell hatalmas mennyiségű, általános szöveges adaton tanul, ami könyveket, cikkeket, weboldalakat és sok más forrást foglal magába. Ennek a szakasznak a célja, hogy a modell megtanulja a nyelv szerkezetét, a világról szóló tényszerű információk tömegét, és azt, hogyan függenek össze a fogalmak egymással. Az előtanítás után kapott modell rendkívül sok mindent tud, de nem feltétlenül viselkedik úgy, ahogy egy hasznos asszisztenstől elvárnád. Hajlamos lehet befejezetlen mondatokat folytatni ahelyett, hogy válaszolna egy kérdésre, vagy pontatlanul teljesíteni egy egyértelmű utasítást.

A második szakasz, finomhangolás és igazítás

Az előtanítást egy vagy több további tanítási szakasz követi, amelyeket összefoglalóan finomhangolásnak vagy igazításnak nevezünk. Ebben a szakaszban a fejlesztő cég konkrét célok mentén alakítja a modell viselkedését. Ide tartozik az instrukciókövetésre való tanítás, vagyis hogy a modell valóban a feltett kérdésre válaszoljon, ne csak statisztikailag valószínű szöveget generáljon. Ide tartozik továbbá az emberi visszajelzések alapján történő tanítás is, amikor emberi értékelők rangsorolják a modell különböző lehetséges válaszait, és a modell megtanulja, melyik típusú válasz a kívánatosabb.

Ez a szakasz alakítja ki azt, amit a modell jellemének nevezünk. Itt dől el, hogy a modell mennyire lesz formális vagy közvetlen a hangnemében, milyen gyakran fog visszakérdezni bizonytalan helyzetekben, hogyan kezeli a kényes vagy vitatott témákat, és hol húzza meg a határt olyan kérések esetén, amelyeket nem hajlandó teljesíteni. A fejlesztő cég ezekben a döntésekben tudatosan érvényesíti a saját értékeit és termékfilozófiáját, ezért érződik olyan másnak egy Claude beszélgetés, mint egy másik szolgáltató terméke.

Miért fontos ez neked, mint felhasználónak

Ha üzleti környezetben dolgozol AI eszközökkel, hasznos, ha nem egyetlen egyetemes AI-ban gondolkodsz, hanem termékekben, amelyeknek mindegyike saját, tudatosan kialakított viselkedési profillal rendelkezik. Az egyik modell talán hajlamosabb tömören és lényegre törően válaszolni, ami jól illik gyors operatív feladatokhoz. A másik talán részletesebb, körültekintőbb választ ad, ami hosszabb, elemző jellegű munkánál előnyösebb lehet. Az egyik szigorúbban utasít el bizonyos kéréstípusokat, a másik megengedőbb. Ezek nem véletlen különbségek, hanem a finomhangolási szakasz tudatos döntéseinek eredménye.

Ennek gyakorlati következménye is van. Ha egy adott AI eszköz válasza furcsának vagy nem odaillőnek tűnik, érdemes megkérdezned magadtól, hogy a probléma a feladatoddal van-e, vagy egyszerűen az adott modell jellemével nem illik össze a helyzet. Van, amikor a megoldás nem a kérdésed újrafogalmazása, hanem egy másik AI eszköz kipróbálása, amelynek a kialakított viselkedési mintázata jobban illeszkedik ahhoz, amit el szeretnél érni.

Fontos azt is látnod, hogy ez a jellem nem statikus és nem tökéletesen megbízható. Ugyanaz a modell hosszú beszélgetés közben, vagy szokatlan kontextusban eltérhet a megszokott mintázataitól, hiszen a jellem is a tanult viselkedés egy formája, nem egy rögzített szabályrendszer. A következő leckében pontosan azt az alapmechanizmust vesszük górcső alá, amely minden AI válasz mögött ott áll, és amely megmagyarázza, hogyan születik meg egyáltalán egy válasz szóról szóra.

A rendszerszintű instrukciók szerepe

Fontos megkülönböztetni kétféle jellemformáló hatást. Az egyik a fejlesztő cég szintjén dől el, a finomhangolás során, és ez adja a modell alap jellemét, amelyet minden felhasználó ugyanúgy tapasztal meg. A másik viszont a te szinteden is alakítható, hiszen sok AI termék lehetőséget ad arra, hogy rendszerszintű instrukciókkal, vagyis egy háttérben megadott, a beszélgetés egészére érvényes utasítással finomíts a modell viselkedésén egy adott alkalmazáson belül. Egy ügyfélszolgálati célra beállított AI asszisztens például kaphat olyan rendszerszintű instrukciót, hogy mindig formális hangnemet használjon, és bizonyos témákat kerüljön.

Ez a kétszintű rendszer, az alap jellem és a rá épülő rendszerszintű finomhangolás, magyarázza, miért viselkedhet ugyanaz a modell látszólag eltérően különböző alkalmazásokban. Ha vállalati környezetben AI eszközöket vezetsz be, érdemes tudnod, hogy ez a rendszerszintű réteg is egy tervezési döntés, amelyet te magad is alakíthatsz, nem csak a fejlesztő cég globális beállításai határozzák meg a végeredményt.

Forrás

Ez a lecke az Anthropic hivatalos "AI Capabilities and Limitations" kurzusának magyar adaptációja, amely az Anthropic Academy oktatási anyagai alapján készült. A kurzus kereskedelmi felhasználásra vonatkozó korlátozásokkal érhető el. Eredeti kurzus. Anthropic Academy.

← Előző lecke Következő lecke →

Workshop

AI Transformation Day

Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.

Érdekel a program →