Maite Oronoz Anchordoqui
Donostiako Informatika Fakultateko irakasle eta ikertzailea, UPV/EHU

Sare sozialetako hizkuntza automatikoki aztertzen depresio zantzuen bila

Aurrekoan «Administrazioa Euskaraz» aldizkarian SARS-Cov-2 birusak suizidioen epidemia ekarri duela berekin irakurri nuen (Oihana Cabello, IVAP, 114. alea). Depresioek, adikzioek eta antzeko gaitzek, baita bakardade eta isolamendu sentsazioek ere, gora egin omen dute. Denbora tarte horretan, hizkuntza-teknologiak eta osasuna uztartuko lituzkeen proiektu batean pentsatzen hasi ginen Ixa ikerketa-taldean. Depresio zantzu horiek sare sozialetan, Twitter-en adibidez, isla izaten dutenez, horiek hizkuntzaren teknologiak erabiliz nola azter zitezkeen ikertzen hasi ginen.

Yates et al. (2017) egileen arabera, gaixotasun mentalak dituzten erabiltzaileek online baliabideetara jotzen dute laguntza bila, bai espezializatutako laguntza komunitateetara, baita Twitter edo Reddit moduko komunitate orokorretara ere. Aipatutako ikerlariek komunitateok aztertzen dituzte depresioarekin zerikusia duten posten bila eta «norberak aitortutako depresio diagnostikoekin» osatutako Reddit datu-sortaren (RSDD) berri ematen dute. RSDD bilduman Reddit sare sozialeko postak biltzen dira eta post horien multzo batean idazleak berak «depresio diagnosia» duela adierazten du. Post hauetan depresioa agertzen den edo ez, eta nork bere burua zauritzeko duen arrisku maila (anbar, gorria etab.) anotatzen da. Suizidio ideagintzaren ingurukoa da, berriz, “Life!” datu-sorta, zeinetan sare sozialetako mezuak alerta mailaren arabera (arriskurik ez, urgentea, posiblea, berehalakoa) etiketatu dituzten, baita mezu motaren arabera ere (depresioa, tristura eta melankolia, suizidioaren inguruko kuriositatea...). Adimen artifiziala baliatuta eta datu-sorta hauek erabiliz, mezuak aipatutako kategoriatan (depresioa bai/ez, adibidez) sailkatzen ikasi ohi da, mezu berri bat jasotakoan, idazlearen egoera inferitzeko helburuarekin.

Guntuku et al. (2021) lanean ospitaleetako larrialdietara oso maiz joaten diren osasun-zentroen “superabiltzaileen” sare sozialak aztertzen dira pertsona hauek beraien egunerokoan ulertzeko asmoz. Supererabiltzaileen mezuen azterketa linguistikoa egitean, hauen mezuek nahasmena, ezezkotasuna, saihestea eta antzeko egoerak adierazten dituztela ondorioztatzen da horretarako termino zehatz batzuk bilatuaz (mozkortuta, deseroso, suminduta, negarrez, urrun...). Pertsona hauek sare sozialetan lehen pertsonako izen ordainak erabiliz aritzen dira eta funtzio hitzak, esanahi lexiko txikiko hitzak, maiz erabiltzen dituzte.

Giza hizkuntzaren teknologiak erabiliz, osasun mentalarekin lotutako diskurtsoa eta sare sozialetan erabiltzen den hizkuntza automatikoki azter dezakegu, idazleetan depresio zantzuak detektatzeko. Hau oso garrantzitsua da gaixotasun hauek hasierako etapetan detektatzeko eta ondorio larriak ekiditen saiatzeko. Pribatutasuna zaintzeko modua bilatuta, osasun profesionalei informazio hau ahalik eta azkarren helarazi beharko litzaieke, esku hartzeko aukera izan dezaten.

Irakurri ahal izan duzuenez, datu-sortak ikerkuntzarako beharrezkoak ditugu, baina gustatuko litzaidake, hasi berria dugun 2022 honetan zailtasun handiak izango bagenitu sare sozialetan depresio seinale horiek topatzeko. Osasuna! •