Ainara Estarrona Ibarloza eta Izaskun Etxeberria Uztarroz
Donostiako UPV/EHUko Informatika Fakultateko irakasle eta ikertzaileak

Egungo teknologia iragana ikertzeko

Urte batzuk ditugunok ongi dakigu zenbat aldaketa ekarri dituen teknologiak gure eguneroko bizitzara. Gaur egun pentsaezina da Internet gabe bizitzea, ez izatea eskura une oro eta toki orotatik era guztietako informazioa (eta desinformazioa) World Wide Web sistemari esker. Baina orain dela ez hainbeste (30 urte inguru?) konputagailua ez zen ohiko tresna lantoki gehienetan eta oso etxe gutxitan zegoen horrelako tramankulurik; egun ezagutzen dugun moduko telefono mugikorrik ere ez zegoen, eta lasai asko bizi ginen. Aspaldiko garaiak badirudite ere, ez da hainbeste denbora pasatu.

Teknologiak gure eguneroko bizitza nabarmen aldatu badu, zientzia egiteko modua ere errotik aldatu du, eta arlo guztietara zabaldu da aldaketa hori. Azken hamarkadan, esaterako, gero eta gehiago entzuten eta irakurtzen da Humanitate Digitalen arloari buruz (Digital Humanities). Informazio digitala prozesatzeko baliabideak eta tresnak Humanitateetako ikerkuntzaren eskura jartzea da arlo horren jomuga, eta helburu hori lortzeko beharrezkoa da Humanitateetako tradiziozko metodo kualitatiboak eta egungo metodo kuantitatiboak elkartzea.

Jar dezagun adibide konkretu bat ideia hobeto ulertzeko. Herrialde jakin bateko gizartearen bizibidea XVI. eta XVII. mendeetan nolakoa zen ikertu nahi bada, interesgarria izan daiteke ikerketa garai hartako testuetatik erauzitako informazioan oinarritzea: testu horietako aditzak erauzteak, esaterako, aukera ona dirudi. Erauzketa eskuz egiteak denbora luzea beharko du, baina testuak formatu digitalean badaude, eta testuak prozesatzeko tresnak gai badira garai hartako testuak analizatzeko (seguru asko garai hartako hizkuntza eta egungoa ezberdinak dira), oso denbora laburreko kontua izango da erauzketa hori konputagailuen bitartez egitea. Horrelako lanari buruzko artikulua publikatu zuten Uppsalako Unibertsitateko Pettersson eta Nivre ikerlariek 2011n, eta adibide egokia iruditu zaigu hona ekartzeko.

Horren ildotik, ezin dugu aipatu gabe utzi azken lau urteetan garatzen aritu garen proiektua Baionako IKER zentroaren eta UPV/EHUko HiTZ zentroko IXA taldearen artean: «BIM, Basque in the making» proiektua (ixa2.si.ehu.eus/bim). Proiektuaren helburu nagusia izan da Sintaktikoki Etiketatutako Euskarazko Corpus Historikoa osatzea, horrek aukera emango baitu euskal gramatikaren ezaugarri nagusien inguruko azterketa diakroniko sistematikoak egiteko. Hala, corpus horren ustiaketak egitura sintaktikoak mendez mende nola aldatzen joan diren erakutsiko digu eta lortutako emaitzak hizkuntzalaritza teorikoaren alorrean egin diren aurkikuntzekin alderatu ahal izango ditugu. Lana ez dago bukatuta, zaila baita horrelako lan bati bukaera ematea inoiz, baina aurrerapen handia egin da: ia milioi bat hitz duen corpusa osatu da dagoeneko.

Horrelako ikerkuntzak eta lanak aurrera eramateko, funtsezkoa da baliabideak eta tresnak konpartitzea, ezagutza elkartrukatzea. Azken hamarkadan, nazioarteko hainbat ekimen jarri dira martxan Humanitate Digitalen arloarentzat azpiegitura egokiak sortzeko eta konpartitzeko. Horien artean daude, esaterako, Europak babestutako CLARIN (www.clarin.eu) eta DARIAH (www.dariah.eu) azpiegiturak, Humanitateetan eta Gizarte Zientzietan ikerkuntza egiteko baliabideak eskaintzen dituztenak. Espainia ez da oraindik partaide ofiziala azpiegitura bi horietan, baina hori lortu nahian ari gara lanean INTELE ikerkuntza sare estrategikoan (ixa2.si.ehu.eus/intele). Eta ildo horri jarraiki, CLARIAH-EUS (ixa2.si.ehu.esu/clariah-eus) egitasmoa ere sustatzen ari gara Europako ikerketa azpiegitura horietan euskara eta euskaraz ikertzeko aukera bultzatzeko asmoz. •