Demis Hassabis, omul care a învăţat un calculator cum să învingă un mare maestru Go

Autor: Bogdan Cojocaru Postat la 25 martie 2016 983 afişări

Cu a 19-a mutare, Alphago şi-a schimbat strategia şi i-a surprins pe toţi. Maestrul Lee Sedol s-a ridicat de la masa de joc pentru a-şi face ordine în gânduri. „Este o mutare creativă“, zumzăie sala. Când Lee Sedol a revenit la masă, pe faţă i se citea o oarecare emoţie - aşa ceva nu a mai făcut nimeni niciodată, nu la un astfel de nivel. „Este ceva nou şi unic, la care trebuie să se gândească“, explică un comentator.

Demis Hassabis, omul care a învăţat un calculator cum să învingă un mare maestru Go

Emoţia este ceva ce-l deosebeşte pe maestrul Lee Sedol de adversarul său, AlphaGo, un program dezvoltat de Google, care prin cele patru victorii contra coreeanului a intrat în istoria omenirii aşa cum a făcut-o şi Deep Blue, al IBM, cu meciurile contra marelui şahist Garri Kasparov. AlphaGo probabil nu realizează, deocamdată, ce a făcut, însă creatorul său, Demis Hassabis, este copleşit de emoţie.

Go este un joc mult mai complex decât şahul şi cere mai multă intuiţie şi strategie, cel puţin de la oameni. Lee Sedol este considerat cel mai bun jucător de Go din ultimul deceniu. Un singur jucător a câştigat mai multe titluri internaţionale decât el, iar Hassabis îl plasează pe locul cinci la nivel mondial. El şi echipa sa l-au ales pe coreean pentru că au vrut ca meciurile să rămână în istorie, scrie revista Wired. Intuiţia sa i-a adus succes. Victoriile lui AlphaGo arată cât de departe a ajuns inteligenţa artificială. Sedol a câştigat un singur meci din cinci.

„Este ceva ce ţine de predare şi învăţare. Un joc nu oferă, pentru o maşină, suficiente date pentru a învăţa, iar pregătirea cere foarte mult timp“, a explicat Hassabis după unul dintre meciuri. După prima etapă, Sedol a recunoscut că a fost „şocat“ de cât de bine a jucat AlphaGo.

„Nu credeam că va juca atât de perfect“, a spus el.

Una din tehnicile de învăţare ale lui AlphaGo a reinventat deja unele  servicii online ale Google şi altor companii mari de internet, ajutând printre altele la identificarea imaginilor, la recunoaşterea comenzilor vocale, la îmbunătăţirea rezultatelor căutărilor. O altă tehnică de învăţare este folosită la roboţii experimentali ai Google şi în cercetările universităţilor de renume.

AlphaGo este ghidat de o tehnologie care-i permite să înveţe şi să acţioneze singur şi să se perfecţioneze pe măsură ce acţionează. Hassabis şi echipa sa au dezvoltat programul utilizând ceea ce ei numesc reţele neuronale profunde, reţele vaste de hardware şi software care imită reţelele de neuroni din creierul uman. AlphaGo a fost învăţat să joace prin scrierea a mii şi mii de mutări umane din jocul de Go în aceste reţele. Apoi, folosind o tehnică numită „reinforcement learning“ – modul în care animalele învaţă, prin intermediul sistemului de recompensă pentru creier pe bază de dopamină –, echipa lui Hassabis l-a pus pe AlphaGo să joace singur, din nou şi din nou. Astfel, programul a învăţat să urmărească mutările care aduc nu cele mai multe puncte, ci probabilitatea cea mai mare de victorie. Aceasta înseamnă anticipare şi strategie.

AlphaGo învaţă singur, fără ajutorul vreunei baze de date, şi cu fiecare joc poate învăţa să fie mai bun. Astfel ajunge să facă mutări surprinzătoare, şi perfecte, cum a fost a 19-a mutare din cea de-a doua confruntare cu maestrul Lee Sedol.

Mutări perfecte în cariera sa a făcut până acum şi Hassabis, un tânăr de 39 de ani cu mamă chinezoaică şi tată cipriot. El visează de mult la aceste victorii, dar nu se va opri aici. Ambiţia sa depăşeşte tabla de Go: vrea să găsească soluţia inteligenţei artificiale şi apoi „să rezolve cu ea orice problemă“.

„Mulţi oameni prognozau că va lua cel puţin un deceniu, aşa că suntem încântaţi că am depăşit acest punct“, spune el pentru Financial Times.

Hassabis este de mic un as al şahului, un programator desăvârşit, designer de jocuri video şi, desigur, expert în neurologie.

La vârsta de patru ani a început să joace şah, la cinci ani concura la nivel naţional şi nu după mult timp la nivel internaţional. La 13 ani era deja recunoscut ca maestru şahist şi jucător la Olimpiada Sporturilor Minţii, unde juca mai multe meciuri în acelaşi timp. Hassabis a câştigat de cinci ori întrecerile pentru elită din aeastă competiţie, un record mondial. Organizatorii l-au descris ca fiind „probabil cel mai bun jucător din istorie“. Legendarul Tim Berners-Lee, inventatorul internetului, l-a descris şi el ca fiind „una dintre cele mai deştepte fiinţe de pe planetă“.

„Una dintre cele mai deştepte fiinţe de pe planetă“ este fan înfocat al lui Liverpool şi nu se fereşte să recunoască faptul că îi plac toate sporturile. Ca spectator.

„Mă plictisesc repede, iar lumea este atât de interesantă. Sunt atât de multe lucruri frumoase de făcut. Dacă aş fi fost un sportiv, aş fi vrut să fiu decatlet“, spune Hassabis.

Tânărul mai are o soră, pianistă şi compozitoare, şi un frate, care studiază literatura creativă. Tehnologia nu a avut o prezenţă remarcabilă în familia lor. Unul din părinţi a deţinut ceva timp un magazin de jucării.

„Sunt cu siguranţă oaia neagră extraterestră a familiei“, glumeşte el, amintindu-şi cum şi-a cheltuit banii câştigaţi în competiţii pe computerele copilăriei lui, deloc ieftine. Pe unul din acestea l-a desfăcut şi astfel şi-a dat seama cum este programat.

„Părinţii mei sunt tehnofobi chiar. Nu le plac computerele, sunt chiar boemi. Fraţii mei au luat-o şi ei pe calea artei. La niciunul dintre ei n-a prins matematica sau fizica. Este ciudat, da. Nu-mi dau seama cum am ajuns aşa.“

Cu acest bagaj informaţional Hassabis a creat compania britanică DeepMind în 2010 alături de prietenul său din copilărie Mustafa Suleyman şi de Shane Legg, cu care a fost coleg de facultate. Dezvoltatorul de inteligenţă artificială a fost cumpărat de Google în 2014 pentru 400 de milioane de lire sterline.

„Ceea ce este şi mai neobişnuit la Denis este că oameni atât de înzestraţi ca el pot fi dificil de abordat. Însă el este deschis, generos şi modest. Nu este deloc arogant“, povesteşte Hermann Hauser, informatician şi antreprenor.

Hassabis a făcut cunoştinţă cu inteligenţa artificială la facultate, la Cambridge, unde profesorii săi insistau cu promovarea unei inteligenţe „înguste“, în care programatorii ataşau „etichete“ informaţiilor pentru ca un computer să le poată folosi. Modelul nu l-a mulţumit pe Hassabis, care a vrut să creeze un sistem „general“ de inteligenţă artificială care utilizează informaţii luate din mediul înconjurător pentru a lua decizii şi face predicţii independent.

Sistemele neuronale ale lui DeepMind fac greşeli, dar în timp învaţă şi devin mai bune. Programele pot juca diferite jocuri şi pot rezolva diferite sarcini. Inteligenţa este generală, aşa cum este cea a omului, nu specifică.

Lui Hassabis îi plac jocurile în care triumfă spontaneitatea umană. A câştigat turnee de poker şi spune că îl încântă astfel de provocări deoarece jucătorii pot pierde chiar dacă au jucat perfect.

Îi place Diplomacy, un joc dificil cu reguli laxe, în care jucătorii trebuie să negocieze înţelegeri, să construiască alianţe şi să şi trădeze pentru a ajunge să domine lumea.

Go este „Sfântul Graal“ pentru inteligenţa artificială. „Ştiu să joc suficient de bine pentru a-i aprecia frumuseţea, însă aici nu sunt puternic. Nu am jucat cu AlphaGo deoarece programul mi-a dovedit încă de la început că este mai bun decât mine“, a explicat Hassabis.

Inteligenţa artificială a mai fost testată în jocuri. În 1997 supercomputerul Deep Blue l-a înfrânt pe Kasparov, campionul mondial la şah de atunci. Într-unul dintre meciuri maestrul chiar s-a simţit agasat de agresivitatea cu care juca computerul. Prin Deep Blue, programatorii au construit un sistem care încerca să analizeze fiecare deznodământ posibil al fiecărei mutări posibile. Însă Go este un joc cu mult, mult mai complex decât şahul. Toate configuraţiile posibile, o bază imensă de date, ar copleşi orice supercomputer, oricât de puternic ar fi el. De aceea pentru o victorie cu un jucător uman era nevoie de tehnologii revoluţionare. Iar AlphaGo le are. Deep Blue poate să bată un maestru şahist, dar n-ar face faţă unui copil de trei ani la aranjatul unor figuri geometrice.

Se poate face o ironie pe seama succesului programului. „Una din curiozităţile progresului fenomenal pe care-l facem cu inteligenţa artificială este că avem un nou campion mondial la Go, dar nu avem un computer care poate muta, fizic, piesele pe tabla de joc“, remarcă Hauser.

Hassabis dă mai multă importanţă creierului electronic decât mâinii. El încearcă să construiască „o maşină universală care poate învăţa“, un singur set de algoritmi flexibili, adaptabili, care pot învăţa aşa cum fac sistemele biologice: să înveţe de la zero să facă ceva folosind nimic altceva decât informaţie brută, după cum observă The Guardian.

În viziunea lui Hassabis despre viitor, maşinării superinteligente vor lucra în tandem cu experţi umani pentru a rezolva toate problemele lumii. „Cancerul, schimbările climatice, genomul, macroeconomia, sistemele financiare, fizica: multe dintre sistemele pe care am vrea să le putem controla devin prea complexe“, spune Hassabis.

„Există un aşa exces de informaţie că devine dificil chiar şi pentru cel mai deştept om să se descurce în timpul vieţii sale. Cum putem cerne acest potop informaţional pentru a găsi ce este cu adevărat relevant? O perspectivă din care poate fi privită inteligenţa artificială generală este ca proces care va transforma automat informaţia nestructurată în cunoştinţe care pot fi folosite. Ceea ce facem poate fi soluţia supremă pentru orice problemă.“

S-ar prea putea ca această soluţie supremă să fie la o depărtare de decenii de noi, însă se apropie. În februarie 2015, revista de ştiinţă Nature prezenta pe copertă „invadatori spaţiali“ alături de dezvăluirea că „un program care învaţă singur“ a atins „în jocurile video performanţe demne de un om“. În revistă, un material al DeepMind descrie primul program funcţional de învăţare generală în care agentul artificial, un algoritm denumit Deep-Q Network, implementat într-un procesor grafic, a învăţat să proceseze informaţiile primite de pe un ecran, să înţeleagă ce sunt acestea şi să acţioneze astfel încât rezultatul să fie cel dorit - în acest caz să devină supraom în jocuri clasice Atari precum Invadatorii Spaţiali, Box şi Pong. A fost ceva monumental pentru lumea ştiinţifică. Câteva luni mai târziu, inteligenţa artificială creată de DeepMind avea să-l înfrângă pe maestrul Lee Sedol, învăţând totul despre un joc vechi de două milenii şi jumătate, în care victoria este adusă mai degrabă de intuiţia jucătorilor decât de forţa brută de calcul a posibilităţilor.

Următorul nivel ar fi, de exemplu, integrarea unei funcţii de memorie şi apoi progres până vor fi puse toate bazele inteligenţei artificiale. „Este esenţial să combinăm toate aceste domenii diferite deoarece suntem interesaţi de algoritmi care pot folosi ce au învăţat dintr-un domeniu într‑un domeniu cu totul nou“, spune Hassabis.

Urmărește Business Magazin

/business-hi-tech/demis-hassabis-omul-care-a-invatat-un-calculator-cum-sa-invinga-un-mare-maestru-go-15146693
15146693
comments powered by Disqus

Preluarea fără cost a materialelor de presă (text, foto si/sau video), purtătoare de drepturi de proprietate intelectuală, este aprobată de către www.bmag.ro doar în limita a 250 de semne. Spaţiile şi URL-ul/hyperlink-ul nu sunt luate în considerare în numerotarea semnelor. Preluarea de informaţii poate fi făcută numai în acord cu termenii agreaţi şi menţionaţi in această pagină.