2019/10/05

Erreportajea
SENTIMENDUEN ANALISIA
Herritar euskaldunek sare sozialetan ematen duten iritzia ezagutzeko sistema

Erakunde eta enpresek dirutza bideratzen dute inkesten bidez herritarren iritzia ezagutzeko. Baina egunotan bada inkestak baino bide oparoagoa: sare sozialak. Horietan jendeak borondatez, noiznahi, nonahi eta doan ematen du bere iritzia. Iritzi horiek bildu, sailkatu eta horietatik ondorioak ateratzeko teknologia garatu dute.

Amagoia Mujika Telleria
1005_sareak2

Egunotan pertsonak datuak omen gara. Erakunde eta enpresek dirutza bideratzen dute inkesten bitartez herritarren iritzia biltzeko eta interpretatzeko. Finean, datu horiek jaso eta erabiltzeko. Eta hara non pertsonek sare sozialetan nahi eran ematen duten iritzia, doan eta borondatez. UPV/EHUko IXA taldeak eta Elhuyarrek Twitter sare sozialean zabaltzen diren txioetatik iritziak erauzi eta sailkatzeko sistema bat garatu dute.

Izan ere, sare sozialak erabiltzaileek sortutako edukien iturri oparoa dira. Edozeri buruzko iritziak ematen ditu erabiltzaileak, nonahi eta noiznahi. Horrek, esanda bezala, berebiziko garrantzia du erakunde, enpresa, alderdi politiko eta beste hainbat eragilerentzat, haien jarduna herritarren iritzien eta gustuen gainean eusten baita nagusiki. «Eragile horiek betidanik izan dute herritarrek edota bezeroek duten iritzia jakiteko interesa. Orain arte inkestak erabili izan dira helburu horrekin, baina garestiak dira, jende gutxirengana iristen dira, berariaz gerturatu behar zara haiengana... Interneten etorrerarekin, iritzi masa izugarria sortzen da une oro», nabarmendu du Iñaki San Vicente Roncalek. Bera da aipatu teknologiaren egile nagusia. «Iritzi masa hori ezin da eskuz landu. Daukan bolumenagatik, beharrezkoa da automatikoki erauzi eta sailkatzea. Beste hizkuntzetan badaude hori egiteko tresnak eta guk euskararentzat pareko baliabidea garatu nahi genuen».

Bereziki Twitter sare sozialean euskara hutsean idatzitako txioak, edo tartean euskara dutenak, izan dituzte langai. «Hasieran euskarazko txioekin hasi ginen, baina Euskal Herrian beste hizkuntzetan ere aritzen gara, edota hizkuntzak nahasten ditugu sare sozialetan... hartara erronka zabaldu egin genuen eta eleaniztasunera jo», zehaztu du San Vicentek.

Izan ere, sare sozialetako hizkuntza berezia da; ahozkotik gertukoa da, maiz ez ditu gramatika arauak betetzen eta bi hizkuntza nahastuta agertzea ohikoa da: «Kaixo. Acabo de hacer la azterketa de gizarte. Fatal atera zait» motako txioak, adibidez, ez dira arraroak. «Twitterren hizkera berezia da; ahozko hizkeratik hurbilago dagoen idatzizko forma dela esaten dugu guk. Letra larriak, enfasia eta oihuak adierazteko moduak, hizkuntzaren nahasketak... gure hizkuntzak hasiera batean hitzak identifikatzen zituen; ‘ondo’, ‘gaizki’, ‘triste’, ‘alai’... baina gero beste gauza horiek lantzeko saiakera egin da; ironia, gramatikaltasun falta, enfasiak... horiek guztiak kontuan hartzen ditu guk garatu dugun teknologiak, sare sozialak ikertzeko behar-beharrezkoak direlako». Eta, noski, emotikonoak ere landu dituzte. «Guretzako oso pista onak dira iritzia eta sentimenduak neurtzeko orduan. Emotikonoak hizkuntza propioa dira gaur egun; batzuk oso argiak dira, besteak anbiguoagoak, baina asko laguntzen dute».

Beraz, hori guztia kontuan hartu behar izan dute sentimenduen analisia deritzon ikerketa-arloan metodo automatiko bat garatzeko orduan. Finean, sare sozialetan euskaraz sentimenduen analisia egiteko teknika bat garatu dute; gertaera baten inguruan pizten diren sentimendu positiboak eta negatiboak identifikatu eta sailkatzeko metodo automatiko bat.

Fokua, gai baten gainean

«Herritar euskaldunek sare sozialetan ematen duten iritzia ezagutzeko sistema bat». Horrelaxe zehazten dute sortzaileek. Baina nola identifikatzen dira sarean herritar euskaldunak? «Baditugu hori egiteko modu desberdinak. Muga geografikoak kontuan har ditzakegu, gaiaren arabera egin dezakegu... Gai batzuk oso mugatuak dira, oso lotuta daude Euskal Herriari, eta pentsatzekoa da horren inguruan iritzia ematen duena gertukoa dela. Hizkuntza, zalantzarik gabe, oso iragazki ona da. Iragazki desberdinak erabil daitezke eta hori automatizatu egin daiteke».

Iragazki horietatik abiatuta, garatu duten teknologiak gai zehatz baten inguruan jartzen du fokua eta horren bueltan sortzen diren iritziak bildu, sailkatu eta nolabait neurtu egiten ditu. «Gai bat definitzen dugu eta sareak entzuten hasten gara. Esaterako, Twitterren gai horren inguruan ematen dena jasotzen dugu. Behin hori jasotzean, informazio masa hori prozesatzen joaten gara. Positiboak edo negatiboak diren neurtzen dugu eta hortik datuen interpretazio bat egiten dugu, ondorio batzuk nabarmendu. Denboran zehar ematen diren iritzi aldaketak, une jakin batean sor daitezkeen ertzak –positiboak edo negatiboak–... Askotariko datuak eta ondorioak atera daitezke. Modu automatikoan neurtu dezakegu ekintza jakin batek, gertaera jakin batek, adierazpen batzuek... zer-nolako erantzuna izan duten».

«Behagunea», lehen froga

“Behagunea” izan zen garatutako sistemaren lehenengo aplikazioa. 2016. urteko Donostiako Europako Kultur Hiriburutzari lotuta, Twitterren esan zirenen sentimenduen analisia egin zuten. «Hiriburutzaren baitan egiten ziren ekimen eta proiektuan inguruko iritziak biltzeko behatoki digital bat izan zen».

Kasu horretan, erantzunen berehalakotasuna neurtu zuen teknologiak, gertaerak sarean publikatu eta lehen hamar minututan ematen ziren erreakzioak. «Finean, termometro bat jartzea bezalakoa izan zen. Gertaera jakin batzuen aurrean nabarmena zen sentimendu negatiboen gorakada. Eta hortik ondorio interesgarriak atera daitezke». “Behagunea” deiturikoaren helburua lehen kolpeko erreakzioak jasotzea bazen ere, denbora horiek alda daitezke, ekimenaren ezaugarrien eta neurtu nahi denaren arabera.

Datuen analisirako tresna

UPV/EHUko IXA taldeak eta Elhuyarrek elkarlanean garatu duten teknologia esparru desberdinetan erabil daiteke. Tresnak “Talaia” izena du eta sareen monitorizaziorako tresna bat da. «Datuen analisirako tresna bat da. Iritziarena bide bat baino ez da, baina beste aukera asko izan ditzake; genero arrakalaren neurketa, hizkuntzaren erabilera, azterketa soziologikoak.... Aplikazio desberdin asko izan ditzake», zehaztu du Iñaki San Vicente Roncalek. Eta tresna garatzen jarraitzen dute. «Esaterako, testuetatik ez ezik, multimedia edukietatik ere gai gara sentimenduak erauzteko».

Sare sozialak gizartearen isla izan daitezke, ñabardurak tarteko. «Kontuan izan behar dugu sare sozialetan iritzia ematen dutenak agian normalean sare sozialetatik kanpo ere iritzia ematen dutenak direla. Akaso ez da beti gertatzen, baina sare sozialetatik kanpo iritzi sortzaileak direnak sare sozialetan ere hala izan daitezke. Gure ustez garbi dagoena da, hutsuneak hutsune, sare sozialek gizartearen irudi fidagarriagoa ematen dutela inkestek baino. Hori da garatu dugun teknologiaren oinarria. Hori da abiapuntua».

Joera orokorra

Pertsonen datu izaera horrek, dena neurtua, interpretatua eta norbaiten interesen arabera erabilia izan daitekeenaren sentipenak egonezina ere sor dezake. «Teknologia ez da txarra, txarra izan daiteke ematen zaion erabilera. Guk erabiltzen ditugun datuak publikoak dira, norberak eta borondatez mundu guztiak ikusteko moduan argitaratuak izan direnak. Ez gara inoren pribatutasunean edo intimitatean sartzen datu horiek lortzeko. Eta horrek bere balioa hartzen du masaren parte bihurtzen denean. Gure sistemak iritziak sailkatzen ditu errore batekin; une honetan arrakasta edo asmatze tasa %75ekoa da. Baina gure teknologiarentzat ez da garrantzitsua mezu bat ondo sailkatua dagoen edo ez, masa da garrantzitsua, joera bat ote dagoen ikustea. Guri ez zaizkigu banakako mezuak interesatzen, orokorrean gertatzen ari dena baizik, joera orokorra. Bestelako eztabaida da gaur egun nola erabiltzen ditugun sare sozialak, arduratsuak ote garen».

«Gure teknologiarentzat ez da garrantzitsua mezu bat ondo sailkatua dagoen edo ez, masa da garrantzitsua, joera bat ote dagoen ikustea. Joera orokorra da interesatzen zaiguna»

Datuen analisirako tresna bat da. Iritziarena bide bat baino ez da, baina beste aukera asko izan ditzake; genero arrakalaren neurketa, hizkuntzaren erabilera, azterketa soziologikoak

Sare sozialetako hizkuntza berezia da; ahozkotik gertukoa da, maiz ez ditu gramatika arauak betetzen eta bi hizkuntza nahastuta agertzea ohikoa da. Hori kontuan hartu dute

«Sare sozialetan sortzen den iritzi masa ezin da eskuz landu. Daukan bolumenagatik, beharrezkoa da automatikoki erauzi eta sailkatzea»