Átment a Turing-teszten a GPT-4 a kutatók szerint

Ez lehet az első alkalom, hogy sikerült teljesíteni a Turing-tesztet.

Ami egyben azt is jelenti: már nem tudjuk megkülönböztetni a mesterséges intelligenciát a valódi emberektől.

Mit is tesztelt a Turing-teszt?

A Turing-teszt a mesterséges intelligencia kutatásának módszere annak meghatározására, hogy egy számítógép képes-e emberként gondolkodni vagy sem, magyarázza a Tech Target. A teszt nevét Alan Turingról, a Turing-teszt alapítójáról, angol informatikusról, kriptoanalitikusról, matematikusról és elméleti biológusról kapta.

Alan Turing szobor — Alan Turing szobra Manchesterben. Forrás: depositphotos.com

Turing azt javasolta, hogy egy számítógépről akkor mondható el, hogy mesterséges intelligenciával rendelkezik, ha bizonyos körülmények között képes utánozni az emberi reakciókat. Az eredeti Turing-teszthez három terminálra van szükség, amelyek mindegyike fizikailag el van választva a másik kettőtől. Az egyik terminált számítógép, a másik kettőt pedig ember üzemelteti.

Az ember a bíró

A teszt során az egyik ember kérdezőként, míg a második ember és a számítógép válaszadóként működik. A kérdező egy adott témakörben, meghatározott formátumban és kontextusban faggatja a válaszadókat. Egy előre beállított idő vagy adott számú kérdés után a kérdező eldönti, melyik válaszadó volt ember és melyik számítógép.

A tesztet sokszor meg kell ismételni. Ha a kérdező a tesztfutások felében vagy annál kevesebben határoz meg helyesen, a számítógép mesterséges intelligenciával rendelkezik, mert a kérdező „ugyanúgy embernek” tekinti, mint az emberi válaszadó.

A jelenlegi szoftvereket is lemérték

A tudósok úgy döntöttek, hogy megismétlik a tesztet úgy, hogy 500 embert kértek meg négy válaszadóval, köztük egy emberrel és az 1960-as évekbeli ELIZA mesterséges intelligencia programmal, valamint a GPT-3.5-tel és a GPT-4-el, a ChatGPT-t működtető mesterséges intelligenciával. A beszélgetések öt percig tartottak, majd a résztvevőknek meg kellett mondaniuk, hogy szerintük emberrel vagy mesterséges intelligenciával beszélnek. A május 9-én a nyomtatás előtti arXiv szerveren közzétett tanulmányban a tudósok azt találták, hogy a résztvevők az esetek 54%-ában emberinek ítélték meg a GPT-4-et.

Az ELIZA rendszerbe előre programozott válaszokat kódoltak, de nem rendelkezik nagy nyelvi modellel vagy neurális hálózati architektúrával, az esetek 22%-ában emberinek ítélték meg. A GPT-3.5 50%-ot ért el, míg a humán résztvevő 67%-ot.

Tévedni emberi dolog – vagy mégsem?

„A gépek képesek konfabulálni, összekeverni a dolgok hihető, utólagos indokait, ahogyan az emberek teszik” – mondta Nell Watson, az Institute of Electrical and Electronics Engineers (IEEE) mesterséges intelligenciával foglalkozó kutatója a Live Science-nek.

„Kognitív elfogultságoknak lehetnek kitéve, megzavarhatják és manipulálhatják őket, és egyre megtévesztőbbek. Mindezek az elemek azt jelentik, hogy az AI-rendszerekben az emberhez hasonló hibák és furcsaságok jelennek meg, ami emberszerűbbé teszi őket, mint a korábbi megközelítések, amelyekben alig volt több, mint a kész válaszok listája.”

A tanulmány – amely több évtizedes kísérleteken alapul, hogy az AI-ügynökök átmenjenek a Turing-teszten – megismételte azokat a közös aggodalmakat, amelyek szerint az embernek tekintett AI-rendszerek „széleskörű társadalmi és gazdasági következményekkel járnak majd”.

Azért még hosszú út áll előtte

A tudósok azzal is érveltek, hogy a Turing-teszt túlságosan leegyszerűsített megközelítésével kapcsolatban helytálló kritikák érik, mondván: „a stilisztikai és szocio-emocionális tényezők nagyobb szerepet játszanak a Turing-teszt sikeres teljesítésében, mint az intelligencia hagyományos fogalmai”. Ez arra utal, hogy rossz helyen kerestük a gépi intelligenciát.

„A nyers értelem csak idáig megy. Ami igazán számít, hogy kellően intelligensnek legyenek ahhoz, hogy megértsék a helyzetet, mások készségeit és empátiával rendelkezzenek ahhoz, hogy ezeket az elemeket összekapcsolják. A képességek csak egy kis részét képezik a mesterséges intelligencia értékének – az a képességük, hogy megértsék mások értékeit, preferenciáit és határait, szintén nélkülözhetetlenek. Ezek a tulajdonságok teszik lehetővé, hogy a mesterséges intelligencia hűséges és megbízható concierge-ként szolgáljon életünkben.”

A bizonytalanság korszaka

Watson hozzátette, hogy a tanulmány kihívást jelent a jövőbeli ember-gép interakció számára, és egyre paranoiásabbak leszünk az interakciók valódi természetét illetően, különösen érzékeny kérdésekben. Hozzátette, a tanulmány rávilágít arra, hogyan változott a mesterséges intelligencia a GPT-korszak során.

„Az ELIZA az előre megírt válaszokra korlátozódott, ami nagymértékben korlátozta a képességeit. Lehet, hogy valakit öt percre megtéveszt, de hamarosan világossá válnak a korlátok” – mondta. „A nyelvi modellek végtelenül rugalmasak, képesek szintetizálni a témák széles skálájára, adott nyelveken vagy szociolektusokon beszélni, és karaktervezérelt személyiséggel és értékekkel ábrázolni magukat. Ez óriási előrelépés az emberi lény által kézzel programozott dolgokhoz képest, akármilyen okosan és körültekintően is.”

Ez is érdekelhet:

Átment a Turing-teszten a GPT-4 a kutatók szerint

Papp Virág

Mit is tesztelt a Turing-teszt?

Az ember a bíró

A jelenlegi szoftvereket is lemérték

Tévedni emberi dolog – vagy mégsem?

Azért még hosszú út áll előtte

A bizonytalanság korszaka

Related Posts

Így néz ki a legnépszerűbb kutyafajták rangsora Magyarországon

Ez a világ öt legveszélyesebb mérgeskígyója

India több millió éven át egy önálló sziget volt

Űrséta űrruha nélkül: eddig bírnád és ez történne a testeddel