Mindenkinek lehet saját mesterséges intelligenciája
TechEgyre több területen használjuk a mesterséges intelligenciát, ugyanakkor az is igaz, hogy túlélnénk, ha egyik pillanatról a másikra nem lenne elérhető. Még nem forgatta fel az életünket, de fokozatosan egyre jobban részévé válik. Horváth Imola, Magyarország vezető adattanácsadó cége, a Hiflylabs fejlett analitika csapatának vezetője összefoglalta, hol tartunk most és milyen irányban zajlanak a fejlesztések.
Gyakorlatilag naponta jelennek meg új fejlemények, fejlesztések, hírek vagy nagy bejelentések a mesterséges intelligenciára (MI) épülő technológiákkal kapcsolatban, főként a generatív modellekre vonatkozóan. A változás szédítő ütemben zajlik, ami sokszor azzal jár, hogy amit ma kijelentünk, az holnapra elavul, meghaladottá válik vagy már nem igaz. A folyamattal kapcsolatban több tényezőt is érdemes kiemelni.
Hihetetlen gyorsasággal fejlődik a generatív MI kompetenciája
Ez nem csak a ChatGPT esetében igaz, hanem a többi alapmodellre is. Egyre több feladat elvégzésére alkalmasak, egyre több területen vethetők be, egyre több problémára adnak jól használható megoldást. Szövegek és képek generálása mellett már zenét is szereznek (dalszöveggel együtt), profi hanghatásokat állítanak elő, sőt, szöveges utasításokból és képi promptokból komplett videójátékokat raknak össze. Szélsőséges példaként említhető az is, hogy az USA hadserege már hadászati tanácsadó szerepben teszteli a generatív MI modelleket.
Külön érdemes foglalkozni a mesterségesen előállított videókkal, mert több jel utal arra, hogy 2024 az MI videógenerálás éve lesz. Az OpenAI februárban publikált új modellje, a Sora néhány sornyi begépelt szövegből képes valósnak ható kisfilmet előállítani. A technológiának ugyan még vannak hibái, amelyek elárulják, hogy nem valós felvételt látunk, ugyanakkor hamarosan komoly kihívást jelenthet a professzionális filmstúdiók számára.
Kiélezett verseny zajlik a generatív modellek között
2023 júliusa óta 14 ezerről 65 ezer fölé emelkedett a ChatGPT-hez hasonló szöveggeneráló nyelvi modellek száma. De nem csak ez az exponenciális növekedési ütem mutatja azt, milyen óriási verseny folyik a generatív MI modelleket fejlesztő cégek és csapatok között. A hétről-hétre megjelenő összehasonlító tesztek alapján ugyanis a versenytársak elkezdtek felnőni az OpenAI-hoz, illetve az iparági etalonnak számító legújabb GPT-4 modellhez. Sőt, a legfrissebb eredmények alapján az Anthropic által fejlesztett Claude 3 család Opus verziója egyes paraméterekben (pl. szakértői tudás, érvelés, kódolás vagy matematika) meg is előzi a GPT-4-et vagy a Google Gemini 1.0 Ultrát. Emellett feljövőben vannak a nyílt forráskódú megoldások is.
A kiélezett verseny idővel a fizetős modellek árazásában is érezteti majd hatását, ami azt jelenti, hogy a technológia még inkább elérhetővé válik mindenki számára.
A mesterséges intelligencia óriási üzletté vált
Az OpenAI 2023 áprilisában jelentette be a GPT-4 új változatát. Ez a bejelentés nem csak a modell fejlettsége és elképesztő paraméterei miatt volt fontos mérföldkő, hanem azért is, mert a cég szakított korábbi gyakorlatával, és az ismertetőben nem részletezték az új verzió architektúráját, méretét és a gyakorló adatokat, tehát szinte semmit, amelynek alapján hasonlót lehetne fejleszteni. A cég egyik társalapítója szerint a nyíltság a múlt hibás gyakorlata, ami egyértelmű beismerése annak, hogy a profit érdekében az OpenAI feladta eredeti küldetését, vagyis azt, hogy ingyenes MI-alapú fejlesztéseivel az emberiség javát szolgálja.
A technológia fejlődése keresztúthoz érkezett. A fő kérdés az, hogy néhány óriásvállalat fogja végérvényesen meghatározni az MI jövőjét, vagy ebbe a nyílt forráskódú megközelítést támogató fejlesztőknek, fejlesztői közösségeknek továbbra is lesz beleszólása? Azt sem szabad elfelejteni, hogy a legnagyobb open source megoldások mögött szintén tőkeerős vállalatok állnak, a LLaMa modellt például a Meta fejleszti.
A tét nagy, hiszen a mesterséges intelligencia óriási üzletté vált, és várhatóan még nagyobbá válik. Hatalmas, tőkeerős cégek és befektetői körök igyekeznek átvenni az irányítást a fejlesztések fölött. Üzleti oldalról tehát nagy az elvárás a növekedés, a megtérülés és a produktivitás szempontjából, aminek nem könnyű gátat szabni.
A helyzet azonban egyáltalán nem fekete-fehér, mert az átláthatóság és a biztonság megőrzése érdekében komoly érvek szólnak a technológia feletti kontroll megőrzése mellett. Már csak azért is, mert a gombamód szaporodó MI startupok és az exponenciálisan emelkedő számú generatív modellek miatt egyre kevésbé áttekinthető a terep, és a nyílt forráskódú MI-fejlesztéseket nem csak magasztos célokra lehet felhasználni, hanem pl. dezinformálásra és propagandára is.
Saját MI oldhatja meg saját problémáinkat
Az előbb már szó esett a generatív modellek kompetenciájának fejlődéséről, illetve multimodális működésükről, vagyis arról, hogy változatos inputokból (szöveg, kód, kép, videó, hanganyag, stb.) gyakorlatilag bármilyen tartalmat képesek előállítani. Azon kívül, hogy az MI ezen a téren minél pontosabb és hatékonyabb legyen, a fejlesztések kapcsán több irány is azonosítható.
Fontos cél például a modellek méretének és hardverigényének csökkentése. Egyrészt az energiafelhasználás és a környezeti terhelés mérséklése érdekében, másrészt azért, hogy lokálisan, akár egy mobiltelefonon is futtathatók legyenek.
Egy másik kiemelt cél a modellek felkészítése arra, hogy ne csak az internetre és egyéb publikus adatforrásokra építve tanuljanak, fejlődjenek, hanem a felhasználók privát adataival is meg lehessen őket kínálni. Ez azt jelenti, hogy idővel mindenkinek lehet saját mesterséges intelligenciája, amelyet a saját problémáira, saját környezetére taníthat fel, és amelyet egyedi karakterrel, egyedi tulajdonságokkal ruházhat fel.
Úton az általános mesterséges intelligencia felé
A fejlesztések egyik legfontosabb csapásirányát az általános kompetencia elérése jelenti. Másképp kifejezve: a multimédiás tartalmak generálásától egyre inkább elmozdulni a valódi tervezés és a cselekvési láncok kivitelezésének irányába. Ez lényegében már az általános mesterséges intelligencia előszobája. De mire képes tulajdonképpen az általános mesterséges intelligencia?
Egy generatív modellt lépésenként lehet instruálni az adott probléma megoldásában, például egy alkalmazás fejlesztésében. Azt viszont nem lehet neki megmondani, hogy magától fejlesszen egy olyan alkalmazást, ami ezt és ezt tudja. Egy általános MI ezzel szemben átgondolja a problémát, cselekvési tervet készít, eszközöket használ és visszajön a megoldással. Ez az ún. ágensként való viselkedés, vagyis az önálló döntéshozásra, tervezésre és cselekvésre alapuló automatizáció.
A fejlett generatív nyelvi modellek megjelenése komoly mérföldkő volt az általános mesterséges intelligencia megalkotása felé vezető úton. Közel lehetünk ehhez a célhoz, de valószínűleg még nem értük el.
Veszélyes megtalálni az informatika Szent Grálját
Az általános mesterséges intelligencia birtokában az irodai jellegű munkák nagy része automatizálható, emberi beavatkozás nélkül is elvégezhető. Ez megfelelő felkészülés és szabályozás nélkül komoly kockázatokat rejt magában, hiszen veszélyezteti a szociális biztonságot és a társadalom egészének működését.
A szabályozás azonban alapvetően eddig mindig utólagos volt, nehezen elképzelhető, hogy most más lesz a helyzet. A témában élenjáró és az AI ACT csomag bevezetése előtt álló Európai Unió is – erős leegyszerűsítéssel – lényegében csak odáig jutott, hogy a „deepfake rossz”. Márpedig a kereteket most kell kitalálni, most kell lefektetni, mielőtt az általános MI valósággá válik. Ha kényszerből kell szabályozni, akkor már baj van.
Az alapvető fejlesztési cél az, hogy egy olyan mesterséges intelligenciát alkossunk, amelynek mi adjuk meg az irányokat, a munka részét viszont ő végzi el. Egy eszközt akarunk teremteni, amelynek mindig is eszköznek kell maradnia. Kifejezetten nem cél, hogy egy önálló entitás jöjjön létre, a vezető kutatók körében alapvetés, hogy öntudatot teremteni etikátlan lenne. Sokan azt hiszik, hogy az általános mesterséges intelligencia valahogy együtt jár az öntudattal, de a lényeg pont az, hogy ne úgy hozzuk létre ezt a technológiát, hogy mesterséges életet teremtünk, hanem úgy, hogy az algoritmusokkal csak utánozzuk az emberi viselkedési mintákat.
Horváth Imola, a Hiflylabs fejlett analitika csapatának vezetője