Aimar Etxeberria Korta
BER2TEK PROIEKTUA

Hizkuntzen teknologia hizkuntzen industriaren zerbitzura jarria

Ber2Tek proiektua aurkeztu berri du Elhuyar Fundazioak. Egitasmoaren xedea hizkuntza teknologiak ikertu eta ikerketaren emaitzak aplikazio bihurtzea izan da, hau da, herritarren eskura jartzeko tresnak sortzea. Tresnok hizkuntzen industrian izan dezaketen eragina erakusteko, hiru demo garatu dituzte.

Elhuyar Fundazioak aurkeztu berri duen Ber2Tek proiektua 2002an abiatutako ikerketa-lerro baten emaitza da. VICOMTECH-IK4 teknologia zentroak, TECNALIA Research and Innovation Fundazioak, EHUko Aholab eta IXA ikerketa taldeek eta Elhuyar Fundazioak berak osatutako partzuergoak garatu du proiektua, hiru urtez (2012tik 2014ra). Baditu, beraz, aurrekariak: 2009tik 2011ra garatutako BerbaTek, 2006tik 2008ra landutako Anhitz edota 2002tik 2004ra bitartean garatutako Hizking XXI, esate baterako.

Bi ardatz nagusiren baitan garatu dute Ber2Tek proiektua: hizkuntza teknologiak eta hizkuntzen industria. Azken horren harira, hainbat datu plazaratu ditu Elhuyar Fundazioko zuzendari nagusia den Leire Canciok. Haren esanetan, hizkuntzen industriak 280 milioi euroko fakturazioa erdietsi zuen pasa den urtean –2014an–, ingurumari ekonomikoan sektore «garrantzitsu» bilakatuz.

Hizkuntza teknologiak, hizkuntzen industrian bertan aplikatzeaz gain, bestelako alor batzuetan ere beharrezkoak direla nabarmendu du Canciok, teknologiak garatu, baliabideak ugaritu eta tresnak berriak sortzeko, besteak beste. Aipatutakoaren harira, bi adibide ematen ditu Elhuyarreko zuzendari nagusiak. «Osasunaren arloan, adibidez, historia klinikoetan dagoen informazio andana kudeatu ahal izateko hizkuntza teknologiak behar ditugu. Bestalde, pertsonen eta makinen arteko elkarrekintza garatu ahal izateko ere, kasu askotan, hizkuntza teknologiak behar ditugu», dio.

Beraz, bestelako teknologia batzuk garatzeko orduan osagarri bilakatzen dira hizkuntza teknologiak. Cancioren esanetan garrantzitsua den beste alor bat hizkuntzarena da. Ingurune eleaniztun batean bizi garela eta, nolabaiteko ekarpena egiten ahalegindu dira Ber2Tek proiektuarekin. «Esan behar da, euskara landu dugula bereziki proiektuan, baina ez da hizkuntza bakarra izan, noski», argitu du. «Aurrera begira ere gure aurrean dugun errealitate hori gero eta modu eraginkorragoan kudeatzeko behar-beharrezkoak izango ditugu hizkuntza teknologiak», azpimarratu du.

Ber2Tek proiektuaren helburu nagusia hizkuntza teknologiak ikertu eta ikerketaren emaitzak aplikazio bilakatzea izanik –ondoren herritarren eskura jartzeko–, teknologia horiek hizkuntzen industrian zertan lagun dezaketen erakusteko hiru demo eraiki dituzte, beste hainbat alorri begira: edukientzako, itzulpengintzarako eta irakaskuntzarako.

Hiru demo

Igor Leturia izan da Ber2Tek proiektuaren koordinatzailea, baita honen emaitzen berri ematearen arduraduna ere. Ikerketaren bokazioa haren emaitzek errealitatean isla izatea dela dio, «eragina izatea gizartean, tresna, aplikazio edo zerbitzu moduan». Horregatik, ikerketa estrategikoa izanagatik ere, hizkuntzen industriara bideratutako demo batzuk sortu dituztela azaldu du, «erakusteko sektore jakin batean zertan lagun dezaketen hizkuntza teknologiek».

Hizkuntzen industria osatzen duten sektoreak, besteak beste, edukiena –komunikabideak, argitaletxeak...–, itzulpenena eta irakaskuntzarena dira –hizkuntzen irakaskuntza–. Ber2Tek proiektuaren baitan eginiko ikerketa, beraz, hizkuntzen teknologia aipatu sektoreetan nola aplika daitekeen erakusteko erabili dute.

Edukien arloari dagokionez, iritzien erauzketa edo sentimenduen analisiaren teknologia zer den erakusten duen demo bat garatu dute. «Iritzien erauzketa gaur egun asko erabiltzen den teknologia da», adierazi du Leturiak. «Denok dakigu egun Interneten edozein produktu saltzen duen enpresaren batek bere produktuaren inguruko kritika eta iruzkinen nondik norakoak jakin nahi dituela –jarraitu du–, eta izugarrizko lana egin behar izaten du sarean iruzkinak aurkitu eta aztertzeko zer iritzi mota dauden».

Arazo horri irtenbide bat eman asmo du garatu duten demoak. Testu bat hartu, iritzi subjektiborik duen aztertu, eta, baldin badu, hura positiboa edo negatiboa den ondorioztatzen du demoak, automatikoki. Modu horretan, enpresa batek erraz jakin dezake bere produktuen inguruan sarean zer esaten den. Hainbat hizkuntzetarako iritzi erauzketa garatu dute, tartean euskara.

Demoa egiteko Armiarma.eus webguneko “Kritiken hemeroteka” baliatu dute. Bertan, hainbat komunikabide eta argitalpenetan ateratako euskarazko 5.000 kritika literario baino gehiago aurki daitezke. Kritika bakoitzari puntuazio bat esleitu diote, automatikoki, Ber2Tek proiektuan garatu duten euskarazko iritzien erauzketaren teknologia aplikatuta. Demoaren webgunean egilea, obra, urtea edo bestelako parametro bat aukeratuta, grafikoki ikus daitezke puntuazioa, kritika bera eta biltzen dituen hitz positibo edo negatibo guztiak.

Itzulpengintzan baliagarri

Itzulpenen arlorako, berriz, bilatzaile multimedia bat garatu dute Ber2Tek proiektuaren baitan. Erakunderen batek bideo asko baditu eta horiek sarean jartzea erabakitzen badu herritarrek kontsulta ditzaten, lan hori modu errazago batean egitea ahalbidetuko lukeen demoa egin dute. «Normalean, eskuz idatzi behar izaten da aurkitu nahi den bideoaren titulua, deskripzio bat edo etiketa batzuk. Baina bideo horretan, agian, hitz asko aipatzen dira eta denak ez daude bilatzeko moduan», azaldu du Leturiak. Horregatik, gaztelaniaz edo euskaraz dauden hainbat bideo hartu, eta, ahots-ezagutza erabilita, automatikoki transkribatu dira.

Modu horretan, behin bideo horien testua lortuta, bilaketak egin daitezke bideoan bertan, baita zuzenean jauzi bilatutako hitza esaten den unera ere. Transkripzio horiek, gainera, automatikoki itzultzen dira gaztelaniara, euskarara edo ingelesera. Ondorioz, azpitituluak automatikoki sor daitezke norberak nahi duen hizkuntzan. Itzulpen horretatik abiatuta, eta hizketaren sintesiaren teknologia erabilita, azpitituluak ez ezik, audioak ere sor daitezke hizkuntza horietan, hau da, bikoizketa automatikoa egin daiteke. Bideo horiek hizlari jakin batzuen hitzaldiak izanez gero, gainera, xede-hizkuntzako bikoizketak jatorrizko hizlariaren ahotsa imita lezake, ahots transformaziorako teknologia erabilita.

Irakaskuntzarako tutorea

Hirugarren demoa hizkuntzen irakaspenean laguntzeko sortua den tutore pertsonal bat da. Duela hiru urte BerbaTek proiektuaren baitan antzeko bat egin bazuten ere, aurkeztu berri dutenak aukera gehiago ematen ditu. Gainera, hura mahaigaineko aplikazio bat zela ekarri dute gogora proiektuaren sustatzaileek, eta oraingo hau on line dagoen tresna bat da, ondorioz, edonork proba dezake.

Demoko tutorea hiru dimentsioko abatar bat da, eta harekin komunikatuko da euskaraz ikasi nahi duen erabiltzailea. Euskaraz egiten du abatarrak, ahoz, eta berari ere modu berean egin behar zaio kontsulta. Demoa erabiliz euskara ikasteko ariketak egin daitezke, hiztegian hitz bat aurkitzeko agindua emateko aukera dago edo deklinabidearekin lotutako kontsulta bat egin daiteke, baita zenbakiak edota datak nola idazten diren galdetu ere. Tutorea den abatarrak gidatuko du euskara ikaslea aditza, deklinabidea edo ulermena lantzeko automatikoki sortutako ariketetan, ahoskera ebaluatuko dio...

Demo bat izanik, ez da euskara ikasle bati erabilgarri suertatuko zaion zerbait proiektuaren koordinatzailearen arabera. Hala ere, sarean eskegi dute jendeak proba dezan, inoiz egiazko komunikazioak sortzeko esperantzarekin.