NAIZ

Elkarrizketak edukitzeko euskarazko txatbotak egiteko modu berria deskubritu du HiTZ zentroak

Euskal Herriko Unibertsitateko HiTZ zentroak metodo berri bat aurkitu du elkarrizketak izateko gai den euskarazko txatbot bat sortzeko.

 

Metaren Llama eredua izan da HiTZ zentroaren ikerketaren abiapuntua.
Metaren Llama eredua izan da HiTZ zentroaren ikerketaren abiapuntua. (Jaque SILVA | NUUR PHOTO | AFP)

Ohar bidez EHUk azaldu duenez, ChatGPT bezalako txatboten erabilera etengabe handitzen ari da, eta lanbide askotan tresna ezinbesteko bihurtzen ari dira. Haien gaitasunak hedatu eta hobetzen dihardute, hala nola, testuak laburtu, edozein gairi buruzko galderak erantzun, ideia jasak egin, programatu, dokumentuak sortu edo dokumentu osoak hizkuntza batetik bestera itzuli.

Hizkuntza nagusietan errendimendu parekoa duten bitartean, euskara bezalako hizkuntza txikiagoetara joatean kalitatea ez da hain ona izaten, hizkuntza horietarako dauden testu masak hain ugariak ez direlako.

Adibidez, Internet irekian dagoen dokumentu kopuruari dagokionean, ingelesez euskaraz baino 1.000 aldiz dokumentu gehiago daude, eta gaztelaniaz, euskaraz baino 100 aldiz gehiago.

Zientzialarien artean galdera irekia izaten jarraitzen du ea posible den halako testu masa urriarekin ingelesaren pareko emaitza onak lortzea.

«Baiezko erantzunaren bidean»

Eneko Agirre EHUko HiTZ ikerketa zentroaren zuzendariaren uste, «lan berri honekin aurrerapen handia egin da galdera horren baiezko erantzunaren bidean, baina oraindik inkognita izaten jarraitzen du».

Artikulu zientifiko batean, HiTZeko kideek elkarrizketak izateko gai den euskarazko chatbot bat sortzeko metodo berri bat aurkeztu dute. Abiapuntua Metak garatutako hizkuntza-eredu eleaniztun eta irekia da, Llama izenekoa.

Ohiko bidea Llama hartzea izango litzateke, hura euskarazko testu eta adibideekin elikatuz, eta horrek lan handia eskatzen du, eskuz eta kostata egin behar baita. Orain arte, enpresa handiek bakarrik har dezakete beregain.

HiTZ-eko kideek lan hori saihesteko hainbat bide probatu dituzte eta, uste zenaren kontra, kalitatezko txatbot bat euskarara egokitzeko metodo berritzaile eta eraginkorra aurkitu dute, eskuzko lanik gabe.

Egindako esperimentu eta garapenek erakusten dute nahikoa dela Llama txatbota euskarazko testuarekin entrenatzea, baina horretarako funtsezkoa dela «ahazte katastrofikoa» (catastrophic forgetting, ingelesez) bezala ezagutzen den arazoa saihesteko teknikak aplikatzea.

Egindako lanak bide berriak irekitzen ditu; izan ere, alde batetik, metodoa bera Llama baino indartsuagoak diren eredu irekiei aplika dakieke, eta, bestetik, antzeko testu-bolumena duten beste hizkuntza batzuei ere aplika dakieke.