‘Euskorpus’ proiektua jarri dute martxan, «euskara esparru digitalean sustatu eta bermatzeko»
‘Euskorpus’ proiektua eta hura garatzeko Euskorpora elkartea aurkeztu dituzte, «lankidetza publiko-pribatuaren bitartez, euskara esparru digitalean sustatu eta bermatzeko». EAEko erakunde publikoen bultzada ekonomikoa lagun, enpresa pribatuek euskara alor horretan garatzeko ekimena gauzatuko dute.
Euskorpora elkarteak ‘Euskorpus’ proiektua jarri du martxan, «lankidetza publiko-pribatuaren bitartez, euskara esparru digitalean sustatu eta bermatzeko», euskararen corpus digitala bilduz, sortuz eta modu aktibo eta metodikoan garatuz. Gaur aurkeztu dute ekimena Gipuzkoako Parke Teknologikoko eraikin nagusian.
Bertan izan dira Imanol Pradales lehendakaria; Ibone Bengoetxea lehendakariorde eta Kultura eta Hizkuntza Politikako sailburua; Mikel Jauregi Industria, Trantsizio Energetiko eta Jasangarritasuneko sailburua eta Juan Ignacio Perez Iglesias Zientzia, Unibertsitate eta Berrikuntzako sailburua, baita ekosistema publiko eta pribatuko beste enpresa batzuk ere izan dira Pradalesek nabarmendu duenez, «Euskorpusek adimen artifizialaren eta hizkuntzaren teknologien potentzial osoa jarriko du euskararen, gure enpresen eta ikerketaren zerbitzura».
Halaber, ekitaldia probestu dute Euskorpora elkartea aurkezteko, hots, xede nagusitzat ‘Euskorpus’ garatzea izango duen erakundea. Elkarte berria euskara esparru digitalean sustatzeaz eta bermatzeaz, euskararen corpus digitala biltzeaz, sortzeaz eta modu aktibo eta metodikoan garatzeaz arduratuko da.
Era berean, euskararentzako kode irekiko oinarrizko ereduak sustatzea bilatuko du, hizkuntza baliabide digitalen Europako esparruari lotuta. Azken batean, ‘Euskorpus’-en bidez, euskarazko datu paketeak garatuko dituzte, fabrikatzaileek sarera konektatutako gailuetan inportatu ahal izateko, euskaraz funtzionatzeko gaitasuna emanez.
Horrela, smartphone, tableta, smartwatch, aplikazio edo Siri edo Alexa bezalako laguntzaile digitalek erabiltzaileekin euskaraz elkarreragiteko gaitasuna izango dute, adimen artifiziala euskalduntzeko prozesuaren baitan. Gainera, adimen artifizialaren eta datuaren kudeaketaren euskal ekosistema dinamizatuko da.
Modu honetan, aurkezpenean adierazi dute ‘Euskorpus’ proiektua «funtsezko tresna» izango da euskarazko corpus digitala sortzeko. Industria, Trantsizio Energetiko eta Jasangarritasun Sailaren bidez, 5,55 milioi euroko hasierako aurrekontu zuzkidura izango du proiektuak; 2025erako bi milioi euro esleituta ditu, eta 2026rako beste hiru milioi euro. Gainera, Kultura eta Hizkuntza Politika Sailak eta Zientzia, Unibertsitate eta Berrikuntza Sailak ere parte hartuko dute proiektuan, 550.000 euroko ekarpena eginez.
Hiru fasetan
Euskararen corpus digitala hiru fase nagusitan gauzatuko da. Lehenengo fasea plangintzarena eta definizioarena izango da, horretarako, corpusaren tipologia eta garatu beharreko ereduak zehaztuko dituen bulego teknikoa eratuko dute eta hura baliatu dezaketen sektore, aplikazio eta zerbitzu estrategikoak zehaztuko dituzte.
Bigarren fasean, euskarazko corpus linguistikoen bilduma bultzatu, kode irekien oinarrizko ereduen garapena bultzatu eta biltegiratze segururako, saiakuntzetarako eta balidaziorako azpiegiturak sustatu nahi dituzte.
Azkenik, hirugarren fasean, bildutako hizkuntza corpusak eta kode irekiko oinarrizko ereduak enpresetara, jendartera eta Europako beste datu plataforma batzuetara transferitzea eta bertan ustiatzea bultzatuko da.
Euskorpus proiektua aurkezteko ekitaldiaren aurretik, Euskorpora elkarteak batzarra egin du. Bertan, enpresa berriek bat egin dute elkartearekin, eta horrela geratu da elkartea osatzen duten enpresa eta erakunde publiko zein pribatuen zerrenda: Vicomtech, EREIL Technologies SL, TREBE Language Technologies, Euskaltzaindia, Eusko Jaurlaritza, Baleuko, MIXER, EiTB, CAF, MCC, Petronor, Euskaltel Fundazioa, Kutxabank, PWC, eta Logikaline.