Ana Zelaia Jauregi
Donostiako EHUko Informatika Fakultateko irakasle eta ikertzailea

Ulertzen al du Googlek zer aurkitu nahi dugun? Eta, zer erakusten digu?

Google da Interneteko bilatzailerik erabiliena; egunero 3.000 milioi bilaketatik gora egiten ditu. Eta gero eta hobea da. Batzuetan gure pentsamendua ere irakurtzen duela dirudi. Zein da bere sekretua?

Hasierako urte haietan PageRank algoritmoan zegoen sekretua. Web-orrien arteko estekak (link-ak) kontuan hartzen zituen algoritmoak, eta kalitate altuko beste web-orri askotatik erreferentziatua izatea onarpen-maila altuaren erakuslea zen. Onarpen-maila horren arabera erabakitzen zen aurkitutakoak erabiltzaileari zer ordenatan erakutsi. Arrakastaren hasiera izan zen (1998).

Interes komertzialeko webguneen administratzaileak berehala hasi ziren emaitzen orrian goren-goreneko posizioetan agertzeko trikimailu bila; zenbat eta gorago, hobe! Ikusgarritasuna handitzea da Bilaketa Motorren Optimizazioaren (SEO, Search Engine Optimization) helburua. Web-orriaren edukia eta esteken erabilera zaintzea gomendatzen zen, posizionamenduan eragiten zuten beste hainbat faktorerekin batera.

Pandak, pinguinoak eta kolibriak nabarmen aldatu zuten Google bilatzailea. Gu ia konturatu ere egin gabe txertatu zaizkio eguneraketak Google bilatzaileari. Aipatzekoak dira kalitate baxuko edukia duten webguneen onarpen-maila jaisteko (Panda, 2011) eta iruzurra egiteko asmoz erabilitako esteka artifizialak aurkitzeko (Penguin, 2012) sortutakoak. Baina filosofia aldaketa nabarmena ekarri zuena kolibria edo Hummingbird (2013) izan zen, bilaketa-kontsulta hobeto interpretatzeko sortua izan baitzen; hitz jakin batzuk dituzten orriak bilatzetik, aurkitu nahi den hori bilatzera pasa zen. Lengoaia naturalean egindako bilaketen garaia hasi zen. Naturalagoa? Gizatiarragoa?

Azken urteotan RankBrain da modako faktorea. Lengoaia naturalean egindako bilaketen ildotik, sekula ikusi gabekoak edo anbiguoak diren bilaketen esanahia ulertzen laguntzeko jaio zen, 2015ean. Neurona-sare artifizial erraldoiak prozesatzen ditu modu automatikoan ikasteko. Horren funtzionamenduaren xehetasunak ez dira ezagutzera eman; ondo gordetako sekretu baliotsua da, noski. Baina web-orrien posizionamenduan duen eragina itzela da.

Ez da modu tradizionalean inplementatutako erregeletan oinarritzen, aurreko algoritmoak bezala. Horren funtzionamendua egokitzeko, neurona-sare artifizialaren geruzetako prozesamendu matematikoa egokitu behar da. Bilaketa kontrolatzeko modua erabat aldatu da, eta aurkitutako emaitzen interpretazioa zailagoa da. Ikasketa sakonaren (deep learning) aroan murgiltzeko apustua egina du Googlek.

Zer gehiago espero dezakegu? Asko hitz egin da 2017an zehar gailu mugikorrentzat optimizatutako webguneei buruz, bilaketa lokalen hobekuntzari buruz eta erabiltzaileen jokaera aztertzeari buruz.

Teknologiaren aurrerakuntzek txundituta, batzuetan etorkizuna dagoeneko hemen dagoela pentsatzen dugu. Baina oraindik ez da existitzen Interneteko bilatzaile semantikorik. Horretarako, gure nahia eta Interneteko informazioa ulertu behar dira. Interesgarria izango da 2018ak zer ekarriko digun ikustea.

Baietz muinean adimen artifiziala eta ikaskuntza sakona egon? Neurona-sare artifizial sakonak erakusten ari dira sendoak eta etorkizun handikoak direla... •