2018/11/03

Elena Lazkano Ortega eta Olatz Arbelaitz Gallego
Donostiako UPV/EHUko Informatika Fakultateko irakasle eta ikertzaileak
Ba al du adimen artifizialak genero joerarik?

Adimen artifiziala edo makina adimena, makinek erakusten duten adimena da; jendarteak eta animaliek aldiz, adimen naturala dute. Gaur egun, adimen artifizialaren helburu nagusiak arrazonaimendua, ezagutzaren adierazpena, ikastea, lengoaia naturalaren prozesamendua eta objektuen identifikazio eta manipulazioa dira besteak beste; eta haren azpitik dagoena informatika, estatistika, matematika, psikologia, linguistika, filosofia eta beste hainbat jakintza arlo.

Konpainia asko dira dagoeneko ikasketa automatikoa eta irudi errekonozimendua erabiltzen dutenak datuei etekina ateratzeko. Hala nola, mailegu-eskaeren sinesgarritasuna balioztatzeko, minbizia duten pertsonentzat tratamendu egokia hautatzeko, iruzurrak detektatzeko, eta abar.

Ikasketa automatikoko algoritmoek datuak behar dituzte ikasteko, datu-base erraldoiak miatuz ezaugarriak eratortzen dituzte gero informazio berria sailkatu ahal izateko. Algoritmoek ikasten dutena, datuetan, matematikan eta estatistikan oinarritzen da batik bat. Ondorioz, ikasteko erabiltzen diren datuek eta egiturek joera bereziren bat badute, ikasitakoan islatuko da hori. Horregatik, maiz, gure inguruan ditugun sistemek genero eta arraza joerak izaten dituzte.

Horrelakoen lehen adibide nabarmenak aspaldi agertu ziren, ahotsa errekonozitzeko softwarearekin batera. Duela hamabost urte, emakumeek zailtasunak zituzten autoak gidatzeko ahotsean oinarritutako sistemak funtzionarazteko, haien ahotsaren doinua entrenamenduetarako erabilitakoaren desberdina zelako.

Ordutik hona sistemak asko hobetu diren arren, haien joerak oraindik arazo dira. Adibidez, bilaketa-tresna informatikoek sarri jotzen dute Wikipediara, baina, Wikipedian bertan, sarrera biografikoen %18 baino ez dira emakumezkoenak. Bilaketen emaitzak, beraz, ezin dira genero aldetik parekatuta egon.

Lengoaia naturalaren prozesamenduan hitzen arteko erlazioak adierazteko erabiltzen diren bektore distribuzionalak (word-embeddings) aztertu dituzte Bostongo hainbat ikertzailek, eta konturatu dira bektoreok dituzten desbiderapenak direla medio, bektoreotan oinarritutako sistemek, adibidez, Jon izeneko pertsonak Maria izenekoak baino ordenagailu programa hobeak egiten dituela ondorioztatzeko joera dutela.

Softwareak argazkien edukia hobeto uler dezan erabiltzen diren datu-baseetan ere antzeman dira genero joerak. Washingtongo Unibertsitatean sortutako ImSitu eta hasiera batean Microsoft eta gaur egun Facebook eta MightyAI. startup-a atzean dituen COCO datu-baseek, adibidez, argazki gehiago dituzte gizonenak emakumeenak baino, eta genero bakoitzeko pertsonekin batera ageri diren irudi eta aktibitateek genero joera handia dute. Izan ere, sukaldeko objektuak emakumeekin lotuta ageri dira, eta, aire libreko kirol-materiala, aldiz, gizonekin.

Ahots laguntzaileak ere ez dira joera horretatik at geratzen. Hain ezagunak diren Sirik, Alexak eta Cortanak, emakume izena eta ahots lehenetsia dituzte; eta berriagoa den Autodesk enpresaren AVA alegiazko laguntzaileak, berriz, ahotsaz gain, emakume itxura ere badu. Horrela, jendartean hain iltzatuta dagoen emakume laguntzaile eta zaintzailearen irudia errepikatu eta hedatzen dute.

Egokia da asumitzea horrelako sistemak sortzeko erabiltzen ditugun datu guztietan desbiderapena dagoela. Desbiderapenak identifikatu eta zuzentzen saia gaitezke klase desberdinen sailkapenerako algoritmo desberdinak erabiliz edota datuetatik problematikoak diren adibideak zein aldagaiak ezabatuz. Baina, oker diseinatutakoa konpondu baino, zergatik ez sortu errotik genero joerarik gabeko sistema adituak? Erraza ez den arren, entrenamendurako genero joerarik gabeko datuak erabiliz gero, haiekin sortutako sistemek modu anbiziotsuan (jendarte idealarekin lerrokatuta) funtzionatzea lortu daiteke, portaera zuzena zabaltzen lagunduz. •