Constantin Orăsan învaţă calculatoarele să vorbească

0

Telefoane mobile care îți spun ce filme poți vedea ori la ce hotel să te cazezi, aplicații care îți analizează preferințele și îți indică reclame în funcție de acestea, programe care te duc în universul inteligenței artificiale, de care suntem mereu fascinați. În spatele lor, de fapt, stau oameni. Oameni pasionați, foarte inteligenți, ale căror întrebări și idei împing mai departe limitele cunoașterii. Deși prea puțin cunoscut țării sale, unul din acești oameni este român.

 

de Camelia Jula


Dacă telefonul tău mobil îți poate răspunde în limba română când îl întrebi ce filme rulează azi, face asta datorită unui program scris, foarte probabil, de un cercetător român. Ca telefonul să te ”înțeleagă” și să îți dea replica, deși pare un proces extrem de simplu, este nevoie de programe complexe și de munca unor oameni specializați în ceea ce timpurile moderne numesc inteligență artificială (IA). Constantin Orăsan este unul din acești oameni, unul dintre cei care ”învață” aplicațiile utilizate de calculatoare ori telefoane mobile să … vorbească.

Lector senior la Universitatea Wolverhampton din Marea Britanie, cu specialitatea ”lingvistica calculatoarelor”, Constantin a plecat din România în 1998, pentru studii post-universitare. A luat drumul Marii Britanii, la doctorat, după ce a absolvit Facultatea de Informatică din cadrul Universității Babeș-Bolyai din Cluj-Napoca și a lucrat un an într-o firmă de programare. În Anglia, s-a orientat înspre cercetare și a ajuns să facă parte din proiecte avangardiste, unele dintre ele pornite de la ideile lui. A obținut numeroase finanțări pentru proiecte, a scris zeci de lucrări științifice și a participat la foarte multe conferințe internaționale în domeniu. Este originar din Sighișoara, pasionat de călătorii și artă fotografică, muzică bună, carte și, desigur, calculatoare.


Foto: Nasa.gov


Tu întrebi, calculatorul sau telefonul răspund

Lingvistica calculatoarelor sau computational linguistics (denumirea originală în engleză) înseamnă ”dezvoltarea unor metode care prelucrează limbajul nostru pentru diverse aplicații pe calculator, telefon mobil sau alte suporturi”, explică Constantin. ”Probabil cel mai cunoscut exemplu este traducerea automată. Dar există multe alte aplicații unde astfel de metode pot fi folosite. Question answering – adică găsirea răspunsului la întrebări – este o altă aplicație populară. Și nu vorbim de sistemul Google, unde pui o întrebare și primești o listă de documente care s-ar putea să conțină răspunsul, ci de un sistem care îți oferă exact răspunsul căutat. Spre exemplu, întrebi ‘ce filme sunt în seara asta la cinema X?’ și aplicația îți dă răspunsul. Ultima tendință este ca astfel de aplicații să fie instalate pe telefonul mobil. Astfel, poți să lansezi înspre telefonul tău întrebarea printr-un mesaj text ori o adresezi direct, în limba ta. Și telefonul îți răspunde”, spune cercetătorul.

Proiectele la care a participat au fost ori solicitări directe din partea unor organizații, ori idei ale lui sau ale departamentului de cercetare al Universității Wolverhampton, din care Constantin face parte. ”O organizație din SUA a fost interesată de generarea automată de teste, e un proiect care se derulează de ani buni deja. A pornit de la ideea că poți găsi ideile principale dintr-un manual și poți transforma propozițiile care conțin aceste idei în întrebări. Astfel, se generează teste grilă cu mai multe răspunsuri, folosite la testarea studenților ori, cum e cazul organizației cu care lucrăm, pentru pregătirea viitorilor medici. Când am avut noi ideea unei aplicații, am dezvoltat-o cu fonduri de la instituții europene sau prin surse de finanțare de la guvernul britanic. Spre exemplu, proiectul QALL-ME, cu mai mulți parteneri, ale cărui rezultate pot fi văzute aici: http://qallme.fbk.eu/”, îmi arată Constantin (este vorba chiar de aplicația prin care telefonul mobil răspunde în limba celui care întreabă, italiană în demo, oferindu-i lista de hoteluri cu acces la internet).

 

Exploatarea opiniilor, o aplicație preferată de multe companii

Una din aplicațiile ”la modă” în prezent este opinion mining (exploatarea opiniei). Ce înseamnă asta, mai exact? ”Înseamnă să vezi ce zice lumea pe bloguri, forumuri sau pe Internet în general despre o companie, un film, o carte, un brand, orice. Foarte multe companii folosesc această metodă pentru a afla ce părere are lumea despre ele. Se merge pe folosirea unui set de cuvinte care indică opinii, apoi se găsește un algoritm care determină dacă textul respectiv este pozitiv sau negativ. Dar, din păcate, nu pot spune că funcționează tocmai bine, pentru că în relatările lor oamenii folosesc metafore, ironie, sarcasm, ceea ce e greu de interpretat de un program. Așa că, în general, programele din această categorie încearcă să găsească texte relevante (sau părți din texte), iar apoi un om le citește pentru a le afla sensul exact. Avantajul cel mare este că nu mai stai tu să cauți orbește pe Internet, pierzând timp prețios. Pe scurt, aplicația strânge informația, dar este nevoie de o minte umană să o interpreteze”, explică Constantin.

Dar cândva, în viitor, vor putea aplicațiile să facă și această analiză, să interpreteze trecând dincolo de complexitatea limbajului nostru plin de substrat? Răspunsul cercetătorului este nu. ”Sau cel puțin nu prea curând… Oamenii sunt prea creativi, există prea multă ambiguitate în limbaj. Analize de acest fel depind de foarte mulți factori pe care nu ai cum să îi indici, pe toți, unui computer. Iată un exemplu, puțin extrem, dar care arată că oricât de multe lucruri ai învăța un calculator, mereu vor fi factori la care nu te-ai gândit: ai mers cu prietenii la restaurant. Au făcut o glumă proasă. Din cauza asta, ți-a picat prost mâncarea, ți s-a stricat seara. Mergi acasă și scrii pe blog un review în care spui că restaurantul e mizerabil. Unui computer nu îi poți explica asta, ca să înțeleagă că, de fapt, restaurantul e ok, dar ție nu ți-a plăcut mâncarea pentru că au făcut amicii o glumă proastă”.

Calculatoarele nu vor comunica la fel ca noi, ci noi vom învăța să comunicăm mai bine cu ele

Filmele SF ne amenință cu momentul în care vom crea inteligența artificială care ne va distruge. Dar cei ancorați în IA au opinii diferite, mai realiste, precum are și Constantin. ”Da, poți crea un instrument care să distrugă, dar nu are nimic de-a face cu inteligența. Putem spune că se întâmplă un fenomen invers: nu doar creăm calculatoare care să prelucreze limbajul nostru, ci, în același timp, învățăm și noi cum să comunicăm mai bine cu ele și să fim tot mai încrezători în răspunsurile pe care ni le oferă, interpretându-le ca inteligență. Uite, să luăm problema long tail (coada lungă). Cauți ceva pe Google, el îți dă răspunsurile despre care crede că sunt bune, tu dai click și ești bucuros că ai găsit ce doreai. Acel click este înregistrat de Google, așa că data viitoare când altcineva caută ceva asemănător, va da aceleași rezultate. Când faci o astfel de căutare, există un long tail, acele pagini pe care nu le vezi dacă nu faci efortul să te duci până la pagina 10 sau 20 sau 30 chiar, dar care s-ar putea să fie mult mai potrivite pentru ceea ce cauți. Te oprești, cel mai adesea, la primele 10 pagini, cu toate că, poate, un răspuns mai potrivit căutării tale s-ar găsi în acest long tail. Așadar, noi suntem cei care ajungem să fim atât de încrezători în ceea ce primim de la calculatoare încât să le considerăm inteligente. În realitate, calculatorul nu înțelege ceea ce vrei tu, doar copiază ceea ce au făcut alți oameni în ‘situații similare’. Putem spune că da, într-o bună zi vor fi inteligente, dar nu așa cum sunt oamenii”.

În prezent, se folosește tot mai mult recomandarea de produse pe baza unor lucruri împărtășite de fiecare dintre noi pe Internet. ”Practic, aici intervine acest concept de opinion mining de care spuneam mai înainte. Ai cont pe Facebook, scrii la statusul tău că ți-ai cumpărat un iPad și ești foarte mulțumit de el, să zicem (n.r.: Este exemplu, nu reclamă!). Vin prietenii și comentează. Toate reacțiile voastre sunt analizate automat. Iar data viitoare când intri în contul tău, Facebook îți va recomanda diverse aplicații pentru iPad, iar prietenilor tăi care și-au exprimat interesul în acest produs li se afișează oferte speciale pentru a cumpăra un iPad. Ajungi să îți faci cumpărăturile la un număr redus de magazine, cu toate că s-ar putea să existe deal-uri mai bune în alte părți, dar tu nu faci efortul să le cauți. Sau ai Facebook Places pe telefonul mobil. Rețeaua îți va recomanda localuri unde să mănânci, tu ajungi să crezi că Facebook are întotdeauna dreptate, faci doar ce ți se recomandă, așa că da, într-un fel, putem spune că un calculator, un program ajunge să te conducă. Depinde cum definim condusul acesta. Tocmai de asta spuneam că ajungem noi să ne modelăm după calculatoare, dar nu calculatoarele la nivelul inteligenței umane”.

La un program se poate munci mult, se investește mult efort și se obțin niște rezultate care par să arate inteligență, mai ales pentru ochiul neavizat. ”A ajunge la o comunicare naturală cu calculatoarele nu se va întâmpla prea curând. Uite, povestea cu IBM și concursul Jeopardy din SUA, acel joc cu întrebări și răspunsuri, contra-cronometru. Acum câteva luni, IBM a realizat un program care a bătut la acest joc doi campioni. Da, rezultatul este spectaculos, dar, atenție, nu este inteligență! Este o realizare din punct de vedere ingineresc, categoric. Din punct de vedere al prelucrării limbajului natural este vorba de un sistem care a fost pregătit pentru un domeniu foarte, foarte specific. Realizarea cea mai mare este că întrebările la acest joc nu sunt chiar atât de clare, matematice, deși sensurile posibile în limbaj erau oarecum determinate de competiție. Deci, calculatorul trebuia, practic, să decidă foarte rapid dacă știe răspunsul corect sau nu și, într-o oarecare măsură, să răspundă pe baza a zeci de mii de perechi întrebări – răspunsuri folosite în ediții precedente ale competiției”, explică Constantin.

La birou (foto din arhiva personală a lui Constantin)


Autor de lucrări, manager de proiecte, programator

Participarea cercetătorului român (cu cetățenie britanică) la aceste proiecte constă în gândirea și elaborarea programelor care stau în spatele aplicațiilor, în management de proiect, dar și în scrierea documentației pentru obținerea fondurilor europene necesare și, respectiv, a lucrărilor științifice. ”Ca echipă, pornim de la o idee, apoi analizăm datele, verificăm ce anume trebuie obținut, scriem diferite programe individuale, testăm, optimizăm, apoi combinăm toate rezultatele și programele împreună ca să implementăm ideea de la care am pornit. Ideal, publicăm și o lucrare despre demers și rezultate și o prezentăm la o conferință internațională, preferabil într-un loc cât mai exotic”, râde Constantin. În 12 ani, de când lucrează în domeniu, a câștigat 14 proiecte de finanțare din diverse surse, inclusiv UE, pentru dezvoltarea unor idei ale sale ori ale departamentului de cercetare unde, în prezent, este deputy head (coordonator adjunct).

”Să obții fonduri europene nu este ușor. Am învățat, la început, din diverse modele să scriu proiecte. Acum am lucrat la destul de multe deja, aș putea să îmi deschid firmă de consultanță”, se amuză Constantin, ”dar prefer să rămân la cercetare. De la guvern vin bani puțini, astfel că, în universități, cercetarea se bazează pe granturi. Multe dintre proiectele la care am lucrat au fost propuse de mine, adică am avut o idee, nu am găsit nimic asemănător realizat, așa că am scris o propunere de proiect și … uneori am primit bani să încerc ideea”, zâmbește cercetătorul; ”dar de cele mai multe ori este o muncă de echipă și ideile se dezvoltă ca urmare a multor sesiuni de brainstorming”. Are peste 50 de lucrări publicate (”la unele am fost co-autor doar”, precizează el) și a pierdut numărul conferințelor la care a participat. În cazul celor mai multe, merge ca și ”speaker” (invitat să susțină o lucrare, o prezentare), dat fiind că munca lui este cunoscută în domeniu.

Pe drumuri mai puțin umblate (foto arhiva personală a lui Constantin)


Călător prin lume, în numele științei

Ideile lui și conferințele la care a participat l-au dus prin multe țări, de unde a strâns o impresionantă arhivă de fotografii. Iar vacanțele și le petrece în locuri cât mai interesante: Tibet, Nepal, Bhutan, Namibia, Vietnam etc. Potrivit site-ului www.travbuddy.com, unde Constantin are harta sa de călătorii, până acum a vizitat 15% din țările lumii. ”Îmi place sud-estul Asiei foarte mult, îmi plac cultura, locurile, mâncarea, totul. Iar Tibetul a fost exact pe sufletul meu”, mărturisește cercetătorul român. Dacă ar fi să se mute în alt loc decât Anglia, ar fi tot un spațiu unde se vorbește engleza. Înapoi în România, însă, slabe șanse … ”există două locuri în România unde se face ceea ce fac eu și nu le este deloc ușor”, spune cercetătorul, conștient că în țara sa de baștină nu ar putea realiza ceea ce realizează în Marea Britanie.

”Anglia mi se pare foarte deschisă la străini. Dacă ești bun, progresezi. În momentul de față, eu am chiar doi doctoranzi români sub îndrumare, pe acest domeniu. Este chiar surprinzător, dacă ne gândim că în universitățile din România nu se predă așa ceva! Plus că acolo se pune mult accentul pe teorie, pe când în UK totul este mult mai practic, mai aplicat. Totuși, doctoranzii care vin aici au un background foarte bun în informatică. La Iași și la București  sunt doi profesori interesați de domeniul în care activez și eu și sunt foarte cunoscuți la nivel internațional. Însă cred că până la urmă vorbim de individualități, de interese particulare care generează cunoașterea și performanța”, mai spune el.

 

În vacanță (foto arhiva personală a lui Constantin)


Dacă ar fi rămas în România? ”Aș fi lucrat la o firmă care dezvolta softuri pentru companii, sper că aș fi ajuns destul de sus, dar probabil că nu aș fi făcut cercetare”, crede Constantin. Acum, în Marea Britanie, face cercetare, este parte din proiecte care lansează aplicații utilizate de mii, poate sute de mii de oameni ori de diverse companii. Predă cursuri la universitate, coordonează un master și doctorate. Pe pagina sa personală de Internet, http://pers-www.wlv.ac.uk/~in6093/, apar toate lucrările sale, precum și proiectele la care a lucrat. Planuri de viitor? Domeniul în care activează nu are limite, practic, imaginația lui poate naște oricând o nouă idee, pentru o nouă aplicație, care va deveni o părticică din aventura comunicării între oameni și jucăriile lor preferate.

Tags:



Leave A Reply