Creatorii unui nou sistem revoluționar care, prin inteligență artificială, generează texte de ficțiune au decis să nu-și publice lucrările de cercetare, de teama că acestea ar putea fi folosit în scopuri distructive, scrie The Guardian.
OpenAI, o organizație nonprofit de cercetare științifică, susținută de giganți ai industriei precum Elon Musk, Reid Hoffman sau Sam Altman, a declarat că noul generator de text, numit GPT2, este atât de performant încât organizația s-a abătut de la practica obișnuită de a publica cercetările care au dus la sistemul inovator, pentru a permite creatorilor să discute mai îndelungat ramificațiile tehnologice ale noii descoperiri.
La bază, GPT2 este un generator de text. În sistemul Inteligenței Artificiale sunt introduse fragmente de text, de la câteva cuvinte până o pagină întreagă, iar acesta produce un text nou bazat pe predicțiile pe care le face în funcție de ordinea logică a textului. Acest sistem redefinește limitele a ceea ce se credea a fi posibil pentru generatoarele de text, atât din punct de vedere calitativ, cât și cantitativ.
Bazat pe primele câteva paragrafe dintr-un articol despre Brexit al celor de la The Guardian, sistemul a generat paragrafe jurnalistice plauzibile, în care se regăsesc citate ale lui Jeremy Corbyn, declarațiile ale purtătorului de cuvânt ale prim-ministrului, menționându-se chiar și granițele Irlandei!
Din punct de vedere al cercetării științifice, GPT2 este revoluționar din două perspective. Unul din ele este amploarea, spune Dario Amondei, directorul de cercetare al OpenAI. Noile modele sunt de 12 ori mai mari și baza de date este de 15 ori mai amplă față de modelele anterioare bazate pe inteligența artificială. Sistemul a fost antrenat pe o bază de date de 10 milioane de articole, selectate din link-uri de pe rețeaua de socializare Reddit care adunau mai mult de 3 voturi. Baza de date are o dimensiune de 40 de GB, suficient pentru a stoca 35.000 de exemplare ale lui Moby Dick.
Cantitatea de date pe care GPT2 o poate procesa a afectat în mod direct și calitatea textului generat, oferindu-i mecanisme de înțelegere a textului scris. Acest fapt a condus la o a două inovație, GPT2 având o arie de expertiză mult mai extinsă, putând fi folosit în scopuri mult mai generale decât modele precedente. Structurând textul care este introdus, algoritmul poate genera rezumate, traduceri și poate chiar trece teste simple de citire și înțelegere, de multe ori depășind performanțele unor sisteme inteligente artificiale construite special pentru un anumit domeniu.
Pe de altă parte, această calitate ridicată a determinat OpenAI să își contrazică propria politică de publicare a cercetărilor pe care se bazează proiectele sale, pe termen scurt, pentru a evalua posibilitățile în care sistemul poate fi folosit de utilizatorii rău intenționați.
Pentru a ilustra acest fapt, echipa OpenAI a creat o versiune a modelului GPT2 cu câteva modificări minore care poate genera un număr infinit de recenzii (pozitive sau negative) pentru diverse produse. Anunțurile spam sau știrile false sunt două dezavantaje evidente, dată fiind natură necontrolată a Inteligenței Artificiale. Sistemul ar putea facil să genereze texte de îndoctrinare, teorii ale conspirației și multe altele.