Ce se întîmplă cînd treci istoria literaturii printr-un algoritm

0

Metoda Jockers e un algoritm de clasificare care analizează statistic cuvintele dintr-un text. Ce se întîmplă cînd treci istoria literaturii prin acest algoritm, cînd îl hrănești cu mii de cărți din diverse secole și examinezi rezultatele?

 

 

 

100 de romane scrise de 50 de autori diferiți din secolul 19 au fost trecute prin mașinăria Jockers. Primul lucru care a fost observat e că poți să ghicești autorul, identitatea textului, naționalitatea, sexul autorului și genul literar în care scrie prin această metodă.

Dacă luăm la întîmplare o carte din serie și o analizăm cu acest algoritm sînt 90% șanse să ghicim numele textului și autorului numai prin comparația combinațiilor de cuvinte și 80% șanse să ghicim dacă e vorba de un scriitor sau o scriitoare. Același proces făcut de un om fără ajutorul tehnologiei nu dă rezultate mai mari de 1-2%. Ceea ce înseamnă că există o bază lingvistică pentru toate acele distincții pe care criticii și istoricii literari le-au făcut pe ghicite și că aceste distincții nu sînt doar construcția lor. Există într-adevăr diferențe măsurabile între autori, națiuni, ere și genuri.

Folosind Jockers, s-au făcut studii și pe temele și influențele dintr-un set de 3346 de romane. Tot după aranjamentul cuvintelor, s-au detectat cu un grad mare de predictibilitate teme precum sărăcia, viața domestică, amero-indienii, Irlanda, servitorii, viața la ferme, viața pe mare. Mai departe, putem să vedem cum se schimbă temele abordate în funcție de naționalitatea autorului sau de perioada în care a scris cartea. Subiecte precum relația dintre chiriași și gazde apar mult mai des în texte irlandeze decît în cele englezești sau americane. La fel, se poate vedea cum piața de carte și interesul cititorilor determină subiectele ficțiunilor, ceea ce înseamnă că oricît de individualist ar fi fost un autor, era determinat în mare parte de așteptările momentului. Prin Jockers se pot vedea și stereotipurile unei perioade. Femeile scriau mai mult despre fericire și afecte, modă și copii, bărbații despre infractori sau personaje negative, dușmani și dueluri.

Jockers poate să analizeze și influențele autorilor și astfel să vadă care cărți au fost mai centrale într-o perioadă și pentru o tradiție literară. Combinînd frecvența unor cuvinte cu frecvența subiectelor și temelor, se poate stabili distanța dintre oricare două cărți sau apropierea. Cele mai influente cărți ar fi astfel cele care au cea mai mică distanță față de cît mai multe alte texte din serie. Rezultatul acestei analize e surprinzător pentru istoricii literari: Tristram Shandy, romanul ciudat, ludic, experimental al lui Laurence Sterne e considerat cel mai influent, urmat de o carte deloc remarcabilă, The Whirlpool de George Gissing. Un rezultat strident care arată limita algoritmului (valabil în schimb cînd vine vorba de influențele pe care literatura unei națiuni o are asupra alteia). Această metodă este însă doar la începuturile ei și în timp va fi rafinată.

Ar putea un algoritm să schimbe canonul literar stabilit de-a lungul deceniilor? Nu, pentru că la baza canonului stau considerente mai puțin matematice, nici măcar influența, deși importantă, nu e un argument decisiv, fiind atîția scriitori buni singulari, care n-au fost imitați. În schimb astfel de analize au o valoare clară științifică, de cunoaștere și ne pot lumina zone pe care mintea umană, fără extensii tehnologice, le stăpînește mai greu.


Leave A Reply

Advertisment ad adsense adlogger