Az AI bevezetése és története

Mit jelent az, hogy egy gép intelligens

A mesterséges intelligencia azt a tudományterületet jelöli, amely azt vizsgálja, hogyan lehet számítógépekkel olyan viselkedést elérni, amelyet embereknél intelligensnek nevezünk. A számítógépeket eredetileg Charles Babbage találta fel arra, hogy jól meghatározott eljárások, vagyis algoritmusok szerint dolgozzanak számokkal. A mai gépek sokkal fejlettebbek, mint a 19. századi eredeti terv, mégis ugyanazt az elvet követik. Ha pontosan ismerjük a célhoz vezető lépéseket, egy számítógépet meg tudunk programozni azok elvégzésére.

Vannak azonban olyan feladatok, amelyeket nem tudunk explicit lépések sorozataként leírni. Ilyen például egy ember életkorának becslése egy fényképről. Ezt emberként megtanuljuk, mert rengeteg példát láttunk különböző korú emberekről, de nem tudjuk pontosan elmagyarázni, milyen szabály alapján jutunk el a becsléshez, és emiatt hagyományos programozással sem tudjuk megoldatni egy géppel. Pontosan az ilyen jellegű feladatok állnak az AI kutatás középpontjában.

Gyenge AI és erős AI

Érdemes már a bevezetőben tisztázni két fogalmat, amelyeket a köznyelv gyakran összemos. A gyenge AI olyan rendszereket jelöl, amelyeket egy konkrét feladatra vagy szűk feladatkörre terveztek és tanítottak be. Ezek a rendszerek kiválóan teljesítenek a saját területükön, de nincs valódi megértésük vagy tudatosságuk. Ide tartoznak a virtuális asszisztensek, mint a Siri vagy az Alexa, a streamingszolgáltatások ajánlórendszerei, és a konkrét ügyfélszolgálati feladatra épített chatbotok. Ma minden létező AI rendszer ebbe a kategóriába tartozik.

Az erős AI, más néven mesterséges általános intelligencia (AGI), olyan rendszert jelentene, amely emberi szintű intelligenciával és megértéssel rendelkezik, és bármilyen intellektuális feladatot el tud végezni, amit egy ember is el tud. Ez ma még elméleti koncepció, egyetlen létező rendszer sem érte el ezt a szintet, és az AGI elérése az AI kutatás egyik hosszú távú célja marad.

Az intelligencia definíciója és a Turing teszt

Az intelligencia fogalmának nincs egyértelmű, mindenki által elfogadott definíciója. Van, aki az absztrakt gondolkodáshoz köti, más az önismerethez, de pontos meghatározás nélkül nehéz eldönteni, mikor beszélhetünk intelligens viselkedésről. Ha megkérdezzük, hogy intelligens-e egy macska, valószínűleg annyi választ kapunk, ahány embert megkérdezünk, mert nincs univerzálisan elfogadott teszt, amely eldöntené a kérdést.

Amikor mesterséges általános intelligenciáról beszélünk, szükségünk van valamilyen módszerre annak eldöntésére, hogy valóban intelligens rendszert hoztunk-e létre. Alan Turing erre dolgozott ki egy javaslatot, amelyet ma Turing tesztként ismerünk. A teszt lényege, hogy egy emberi kérdező szöveges párbeszédet folytat egy másik féllel, anélkül hogy tudná, embert vagy gépet szólít meg. Ha a kérdező nem tudja megbízhatóan megkülönböztetni a két felet, a rendszert intelligensnek tekintjük.

Érdemes tudni, hogy 2014-ben egy Eugene Goostman nevű chatbot közel került a teszt teljesítéséhez, de nem azért, mert valódi intelligenciát mutatott, hanem mert ügyesen egy 13 éves ukrán fiú szerepét alakította, ami megmagyarázta a hiányos tudását és a szöveg apró következetlenségeit. Ez a példa jól mutatja, hogy a Turing teszt megtévesztése önmagában még nem bizonyítja a valódi intelligencia meglétét.

Két alapvető megközelítés: felülről lefelé és alulról felfelé

Ha azt szeretnénk, hogy egy gép emberi módon viselkedjen, valahogyan modelleznünk kell a gondolkodásunkat a számítógépen belül. Ehhez két, gyökeresen eltérő stratégia alakult ki a kutatás történetében.

A felülről lefelé irányuló megközelítés, más néven szimbolikus gondolkodás, azt próbálja modellezni, ahogyan egy ember érvel egy probléma megoldása közben. Ehhez tudást kell kinyerni egy szakértőből, és azt gép által olvasható formában kell ábrázolni, majd meg kell alkotni egy módszert, amellyel a gép ezen a tudáson tud következtetni. Egy orvos például fejben tartott szabályok alapján állít fel diagnózist, és ezek a szabályok elvben egy szabálybázisban is rögzíthetők. A probléma az, hogy egy szakértő gyakran maga sem tudja pontosan megfogalmazni, milyen szabály alapján jut el a végkövetkeztetéshez, ezért a tudás kinyerése rendkívül nehéz feladat.

Az alulról felfelé irányuló megközelítés ezzel szemben az agy legegyszerűbb elemét, a neuront próbálja modellezni. Egy mesterséges neurális hálózatot építünk fel a számítógépen belül, majd nagy mennyiségű példa segítségével megtanítjuk problémák megoldására. Ez a folyamat hasonlít ahhoz, ahogyan egy csecsemő tanulja meg felismerni a környezetét, saját megfigyelésein keresztül.

A gépi tanulás kifejezés arra a részterületre utal, amely azon alapul, hogy a gép adatokból tanulva old meg problémákat. Ez a lecke a szimbolikus és a neurális megközelítést mutatja be, a klasszikus gépi tanulás módszereit a következő leckék tárgyalják részletesebben.

Az AI rövid története

Az AI mint önálló tudományterület a huszadik század közepén született meg. Kezdetben a szimbolikus gondolkodás volt a domináns irány, és ez vezetett a szakértői rendszerek megjelenéséhez, olyan programokéhoz, amelyek egy szűk problématerületen szakértőként tudtak működni. Hamar kiderült azonban, hogy ez a megközelítés nehezen skálázható. A tudás kinyerése egy szakértőtől, gépi ábrázolása, és a tudásbázis pontosságának karbantartása rendkívül összetett és költséges feladatnak bizonyult sok gyakorlati esetben. Ez vezetett az úgynevezett AI télhez az 1970-es években, amikor a terület finanszírozása és lelkesedése jelentősen visszaesett.

Ahogy a számítási kapacitás olcsóbbá vált, és egyre több adat állt rendelkezésre, a neurális hálózatokra épülő megközelítések kezdtek látványos eredményeket elérni olyan területeken, mint a képfelismerés vagy a beszédértés. Az utóbbi egy évtizedben a mesterséges intelligencia kifejezést a köznyelv gyakran a neurális hálózatok szinonimájaként használja, hiszen a legtöbb ismert AI áttörés ezen az architektúrán alapul.

Jól illusztrálja ezt a fejlődést a sakkozó programok története. A korai programok kereséssel dolgoztak, vagyis kiszámolták az ellenfél lehetséges lépéseit néhány lépésre előre, és ez alapján választották ki az optimális lépést, ez vezetett az úgynevezett alfa béta metszés algoritmusához. A keresés jól működik a játék végén, amikor kevés lehetséges lépés marad, de a játék elején hatalmas a keresési tér, ezért a későbbi programok emberi partik elemzéséből is tanultak. A ma emberi játékosokat legyőző programok neurális hálózatokra és megerősítéses tanulásra épülnek, ahol a rendszer saját maga ellen játszva, a saját hibáiból tanulva fejlődik, csak sokkal gyorsabban, mint egy ember tudna.

Hasonló fejlődési ív rajzolódik ki a beszélgető programoknál is. A korai rendszerek, mint az Eliza, egyszerű nyelvtani szabályokkal dolgoztak, és a bemeneti mondatot alakították át kérdéssé. A mai virtuális asszisztensek, mint a Siri vagy a Google Assistant, hibrid rendszerek, amelyek neurális hálózatokkal alakítják át a beszédet szöveggé és ismerik fel a szándékunkat, majd explicit logikával hajtják végre a kért műveletet. A legújabb nagy nyelvi modellek, mint a GPT család, már egyetlen neurális hálózattal képesek kezelni a teljes párbeszédet.

A neurális hálózatok kutatásának új hulláma

A neurális hálózatok kutatásának mai fellendülése nagyjából 2010 körül indult, amikor nagy méretű, nyilvánosan elérhető adathalmazok jelentek meg. Az ImageNet nevű gyűjtemény, amely körülbelül 14 millió címkézett képet tartalmaz, hívta életre az ImageNet Large Scale Visual Recognition Challenge nevű versenyt, amely az elmúlt évtized egyik legfontosabb mérföldköve lett a képfelismerés fejlődésében.

2012-ben alkalmaztak először konvolúciós neurális hálózatot képosztályozásra, ami jelentősen, közel 30 százalékról 16,4 százalékra csökkentette az osztályozási hibaarányt. 2015-ben a Microsoft Research ResNet architektúrája elérte az emberi szintű pontosságot ebben a feladatban. Azóta sorra dőltek a mérföldkövek, 2016-ban a beszédfelismerésben, 2018-ban a gépi fordításban, 2020-ban pedig a képek automatikus leírásában sikerült emberi szintű teljesítményt elérni. Az elmúlt években a nagy nyelvi modellek, mint a BERT vagy a GPT-3 sikere elsősorban annak köszönhető, hogy hatalmas mennyiségű szöveges adat áll rendelkezésre, amelyen a modellek előbb általánosan, majd konkrét feladatokra specializálva taníthatók be.

Forrás

Ez a lecke a Microsoft nyílt forráskódú, MIT licenc alatt elérhető "AI For Beginners" tananyagának magyar adaptációja. Eredeti angol lecke. GitHub. Felhasznált magyar gépi fordítás. GitHub.

Következő lecke →

Workshop

AI Transformation Day

Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.

Érdekel a program →