Cum putem măsura sentimentele în online? Știm exact ce atașament implică un Like pe pagina de Facebook a lui Băsescu, Ponta sau X-ulescu? Și dacă da, cât de pregătiți suntem să înlocuim învechitele exit poll-uri cu măsurători precise ale febrei sociale autentice din www?
de Cosmin Popan (Das Cloud)
Salata, ciocolata, pizza, ouăle și clătitele sunt mâncărurile preferate ale românilor de pe Twitter. La polul opus, puiul cu curry (Ne scuzaţi!) și cerealele sunt cele mai detestate feluri de mâncare. Cel puțin asta deducem din ceea ce ne spune un soft care analizează, din aprilie 2011 încoace, sentimentele faţă de chestiuni culinare ce se întrezăresc prin tweetosfera autohtonă. Ambiția aparține unei mici companii olandeze, Jana and Koos, care a dezvoltat un proiect dedicat mâncării și emoțiilor, FoodMood, care realizează vizualizare interactivă de informație. Proiectul urmărește, după cum spun inițiatorii, “să obțină o mai bună înțelegere a modelelor de consum alimentar global, precum și impactul asupra bunăstării emoționale zilnice al oamenilor, toate corelate cu PIB-ul și nivelul de obezitate din țările din întreaga lume”.
Dar cum ajunge FoodMood să scormonească prin farfuriile românilor? “Urmărim geo-locația tweet-urilor ca sursă primară de informație, însă adăugăm și tehnici de procesare a limbajului natural alături de date publice de la Organizația Mondială a Sănătății și CIA Factbook. În acest fel, surprindem și analizăm în timp real alimentele despre care vorbesc oamenii pe Twitter și sentimentele pe care le exprimă față de acestea”, răspund cei din spatele proiectului.
Oricât de mari devoratori de ciocolată și pizza am fi unii dintre noi, e totuşi greu de presupus că, la nivel macro, marile pohte ale românilor ce au pohtit ar fi chiar astea. Există doar 50.000 de conturi de Twitter active, iar FoodMood urmărește doar tweet-urile scrise în engleză. Până să putem face corelații cu adevărat relevante între preferințele culinare declarate pe diverse rețele sociale de către români și politicile de alimentație publică ce-ar trebui dezvoltate pentru sănătate populației, mai e drum lung. Dar asta nu ne împiedică să asistăm la avântul tot mai mare al instrumentelor ce se dau de ceasul morții să afle sentimentele care animă rețelele sociale față de un subiect sau altul.
Un alt exemplu, tot de dată recentă, este roata gigantică London Eye de pe malul Tamisei, care va oferi pe durata Jocurilor Olimpice de la Londra un show vizual animat cu ajutorul emoțiilor recenzate de pe Twitter. Proiectul, intitulat “Energy of the Nation”, folosește un algoritm de măsurare a sentimentelor, combinat cu tag-uri de geo-locație și adrese IP pentru a observa ce reacții emoționale exprimă utilizatorii Twitter pe parcursul competiției sportive.
Miza politico-economică a sentimentelor
Procesarea computerizată a limbajului natural este o tehnică emergentă, folosită în special de către marile companii pentru a verifica eficiența campaniilor de comunicare pe care le întreprind în spațiul online. Procedeul a început să facă cu ochiul și altor domenii de activitate, precum politicul sau economicul. Simpatia pentru un actor politic sau altul a început să fie măsurată și altfel decât pe baza sondajelor de opinie și a exit poll-urilor care au o istorie mai veche în spate. Fluctuațiile burselor de valori au fost conectate direct și ele la tensiunile populare exprimate în timp real pe Twitter.
De la lansarea din octombrie 2006, microbloggingul Twitter a devenit terenul preferat de joacă al celor ce analizează trenduri sociale-politice de tot felul. În toamna lui 2008, odată cu alegerile prezidențiale din SUA, Twitter-ul a început să fie exploatat pentru conturarea unor predicţii despre candidatul înspre care vor merge cele mai multe voturi. Un studiu (.pdf) realizat de cercetători în informatică și astrofizică de la universitățile Indiana și Harvard a ajuns la concluzia că există o strânsă legătură de tip cauză-efect între evenimentele din sfera socială, politică, culturală și economică și starea sufletească a oamenilor reflectată pe rețelele sociale. Previzibil, nu?
Un an mai târziu, la alegerile federale din Germania, analize mai rafinate au ajuns la concluzii mai apropiate de ceea ce se așteaptă de la o rețea socială ce pulsează în același ritm cu intențiile ulterioare de vot. O echipă de cercetători de la Universitatea Tehnică din Munchen a analizat peste 100.000 de mesaje de pe Twitter care făceau referire la partidele politice şi/sau politicienii aflați în cursa electorală din landurile Germaniei (vezi studiu aici – .pdf). “Rezultatele arată că Twitter este utilizat intens în cadrul dezbaterii electorale. Am ajuns la concluzia că pur și numărul de mesaje ce menționează un partid este fidel reflectat în rezultatele alegerilor”, spune echipa de cercetători.
În domeniul financiar, analiza de sentimente de pe Twitter este la fel de prețuită, după cum arată un studiu realizat acum doi de altă echipă de cercetători de la Universitatea Indiana (.pdf). Aceștia au analizat milioane de tweet-uri pentru a prezice fluctuațiile bursei de valori la distanță de trei zile cu o acuratețe de 87%. Acest succes a dezlănțuit, spune The Economist, o adevărată modă în rândul experților de pe Wall Street, care au început să introducă așa-numita “analiză de sentimente” din social media în cadrul deja complexelor modele de predicție financiară.
Ironia ciripită, cuiul lui Pepelea
Codul ciripiturilor de pe Twitter nu a fost în întregime descifrat, constată, totuși, anumiți experți care se feresc să înlocuiască complet metodele clasice de sondare a opiniei publice. Una dintre cele mai grele misiuni în efortul de procesare a limbajului natural din online este, pare-se, interpretarea postărilor cu potențial ambiguu sau formulări sarcastice. Chiar și oamenii le înțeleg uneori cu dificultate subtilitatea, darămite un biet computer. Un “Bravo, Băsescule, o făcuși și pe asta!” poate suna de bine, deşi conotaţia sa este cât se poate de negativă. “Uneori putem fi induși în eroare de sarcasm. Nu avem un detector pentru așa ceva”, spune Bruce Smith, cercetător în cadrul companiei californiene de monitorizare socială Emeryville. O altă problemă ține de faptul că e greu de verificat atunci când o singură persoană postează în paralel pe mai multe conturi de Twitter.
Avantajele mineritului de sentimente în online față de sondajele clasice cu rigoare sociologică sunt însă evidente, iar acesta e motivul pentru care vom asista în viitor la rafinarea acestor tehnici. Colectarea de date în timp real este un avantaj pe care doar online-ul e capabil să îl ofere. De asemenea, cei care sunt fani ai acestor noi tehnici mai observă că oamenii sunt adesea mai sinceri atunci când comunică cu prietenii într-o rețea socială decât atunci când o fac în fața unui intervievator necunoscut. “Poți obține o imagine mai aproapiată de realitate a intențiilor acestor oameni. Spun mai degrabă ceea ce vor face decât ce cred că vrei tu să îți spună”, explică Lisa Joy Rosner, reprezentant NetBase, o altă companie de analiză în zona social-media.
Intențiile și sentimentele de tot felul exprimate în online nu coincid, cel puțin în cazul românilor, cu acțiuni concrete ulterioare. E suficient să ne amintim de entuziasmul cu care peste 40.000 de bucureșteni au dat “attend” pe Facebook la protestele anti ACTA din februarie, dar care s-a soldat cu doar câteva sute de participanți în Piața Universității. Mulți români suferă de clicktivism, spune antropologul Bogdan Iancu. “Dau click în semn de susținere sau de contestare, dar nu participă, de fapt, la procesul decizional. Rețelele sociale induc senzația de participare civică, dar de multe ori această așa-zisă participare se face direct de la job, nu din stradă”.
Subiectivitatea doftoricită manual
În România, cercetările de sentimente în social media sunt încă un domeniu virgin. Serviciu de monitorizare Zelist Monitor se încumetă să facă o incursiune în domeniul “emoțiilor sociale”, însă procesul de reperare a sentimentelor este făcut manual, după cum explică Răzvan Bucur, PR & Social Media Specialist în cadrul companiei Tree Works: “Zelist Monitor nu oferă în momentul de față analiză automată de sentiment. Am realizat numeroase teste pe baze de date cu zeci de mii de menționări, iar rezultatele nu au fost suficient de bune”.
Bucur crede că nici măcar o muncă manuală de detectare a sentimentelor nu este infailibilă – “Analiza de sentiment, indiferent dacă vorbim despre cea realizată automat de un soft sau despre cea realizată manual de un operator, este un proces foarte subiectiv. Ce poate fi considerat ca pozitiv de o persoana sau într-un context anume, poate fi considerat neutru de altă persoana sau pentru alt context. Complexitatea și nuanțele limbii române, combinate cu tehnologiile disponibile în acest moment pentru analiza de text, fac ca analiza de sentiment automată să nu poata atinge un nivel de acuratețe de 100%. Nici măcar de 90%”.
Din acest motiv, spune Bucur, Zelist Monitor nici nu oferă servicii automate, dar le dă utilizatorilor serviciului posibilitatea să facă individual analiză manuală de sentiment. “Fiecare menționare este citită în context și este tag-uită pe scara celor 5 valori predefinite ale sentimentului: foarte negativ, negativ, nici negativ nici pozitiv, pozitiv, foarte pozitiv. Fiecărei menționări i se mai adauga subiectul discuției astfel încat la final să poți face și corelații între subiect și sentiment”. Tree Works are, totuși, operatori care fac această muncă migăloasă pentru clienții dispuși să plătească, spune Bucur. “Avem clienţi din domeniul bancar sau FMCG (Bunuri de larg consum – n.n.) interesați și de analiza manuală de sentiment per brand sau per campanie. Operatorul le poate oferi diferite insight-uri pe care nu le-ar putea obține de la analiza automată. Majoritatea acestor clienți utilizează analizele pentru a-și verifica campaniile desfășurate în online și a corija acolo unde este cazul micile probleme apărute”.
Softurile online cu acces liber care măsoară sentimente au apărut ca ciupercile în ultimii ani. Am testat unul dintre ele, Social Mention, care monitorizează doar postările în engleză. Mai trebuie spus că pulsul luat de Social Mention este făcut automat, fără ajutor din partea unui programator, care să introducă manual termeni predefiniți care să exprime o stare de spirit pozitivă sau negativă în rândul internauților români. Am comparat trei subiecte de maximă actualitate, Victor Ponta, Traian Băsescu și Referendum pentru a vedea care este sentimentul general în social media față de fiecare dintre acești termeni. Ne-a ieșit asta:
Acest material a fost preluat de pe site-ul partener Das Cloud.