Aurtengo azaroan izango da Californiako Santa Cruz hirian GAMNLP-15 biltzarra. Biltzar honetan, hizkuntzaren prozesamenduak eta bideojokoek elkarrekiko duten interakzioan oinarrituko dira, bi alorren elkarrekintzak ikerkuntzari ekar diezaizkiokeen onurak aztertzeko. Biltzar hau laugarren aldiz egingo da aurten, lehenengoa 2012an izan da, urtero bat eginez. Hizkuntzaren prozesamenduan aritzen naizenez, biltzar honen berri edukitzeak artikulu hau idaztera bultzatu nau.

Hizkuntzaren prozesamendua pertsona eta makinen arteko komunikazioa, baita pertsonen artekoa ere, errazteko tresna konputazionalak ikertzeaz arduratzen da. Ikerkuntzarako hainbat ataza topatu ditzakegu alor honetan, hala nola itzulpen automatikoa, laburpengintza automatikoa, kategoria gramatikalen etiketatzea, informazioaren erauzketa, ahotsaren prozesamendua, besteak beste.

Gu ez gara konturatzen, baina gure artean teknologia hauek asko erabiltzen dituzten aplikazioak ditugu:

  1. Google bilatzailea.
  2. Xuxen zuzentzaile ortografikoa.
  3. Google Translate itzultzaile automatikoa, eta Mitzuli itzultzaile librea.
  4. Elhuyar hiztegi eleanitza.
  5. Euskarazko txioak filtratzen dituen UMAP proiektua.
  6. Euskarazko AhoTTS ahots prozesatzailea.
  7. BertsoBot robot bertsolaria.
  8. eta beste hainbat.

Baina nola aprobetxa daiteke hizkuntzaren prozesamendua bideojokoetan? Ondorengo lerroetan komentatuko ditut batzuk.



Hasteko, Microsoften Kinect tresna ezaguna dugu. Tresna honek jokoak mugimenduaren bidez kontrolatzeko aukera emateaz gain, gizakion ahotsa detektatzen du. Erabiltzaileak ahots komandoak bidali eta honek obedituko du, kontsola piztu edo itzaliz, jokoak martxan jarriz, eta abar. Xbox One kontsolatik Bing bilatzailea erabiltzeko aukera ere ematen digu, ahots komando batzuk erabiliz nahi dugunaren bilaketak egin ditzan.

Anekdota bezala, 2009ko E3 erakusketan Project Milo jokoa aurkeztu zuen Microsoftek, Kinekten potentziala erakusteko asmoz. Joko honetan, erabiltzaileak jokoan agertzen zen pertsonaiarekin interaktzen zuen, bien artean elkarrizketa bat edukitzeko aukera emanez. Zoritxarrez, proiektu honek inoiz ez zuen argia ikusi. Horrez gain, jokoa ez zen gai automatikoki elkarrizketarik sortzeko, dena aurretik prestatutako antzerki bat baino ez zen izan. Dena den, bada jende asko elkarrizketen sorkuntza automatikoan ikertzen, baina oraindik asko dago egiteko.

IBMk garatutako Watson superkonputagailua da ondorengo adibidea. Jeopardy lehiaketa oso arrakastatsua da AEBtan, bertan aurkezleak erantzun bat ematen du, eta lehiakideak erantzun horren galdera zein den asmatu behar du. Watsonek ere parte hartu zuen bertan 2008an, lehiaketaren historian puntuazio altuenetarikoa eskuratu zuten bi lehiakideren aurka. Watsonek irabazi zuen, konputagailuak barnean duen galderen sorkuntza sistemari esker.

Bada lan bat, non eszenatokien sorkuntza automatikoa aztertzen duten. Lan honen helburua oso sinplea da: erabiltzaileak eszenatoki bat testu bidez deskribatzen du, eta ordenagailuak automatikoki testua analizatu ondoren, bertan deskribatutako eszenatokia prozesatzen du.

Imagina ezazue zernolako potentziala duen honek eszenatokiak gure gustura pertsonalizatzeko aukera ematen duten jokoetan. Nori ez litzaioke gustatuko Minecraften adibidez, nahi duen eszenatokia deskribatzea eta honek zuzenean hura sortzea, blokeak pixkanaka jarriz? Gauza bera Trackmaniako jokoetan guk nahi ditugun zirkuituak sortzeko, edo LittleBigPlaneten faseak erraz sortzeko. Guzti hau noski, oinarria sortu ondoren guk geure gustura aldaketak egiteko aukerarekin, ez da perfektua izango baina zailena eginda dago.



Topatu dudan beste lan batean, GameSpot eta IGNko erabiltzaile desberdinek idatzitako jokoen analisiak biltzen dituzte, eta hauek aztertu. Analisi bakoitzeko alderdi desberdinei buruz idazleak duen iritzia jasotzen dute. Honek ez dauka praktikotasun handirik erabiltzaileen ikuspegitik, baina oso lagungarria da jokoen garatzaileentzat: honi esker, erabiltzaileei gehien gustatu zaiena eta ez zaiena jakin dezakete, analisi bakoitza banaka irakurri gabe; garatuko duten hurrengo jokoan badakite erabiltzaileak pozik uzteko zer den kontuan hartu beharrekoa. Analisi guztiak banan-banan irakurtzeak bere denbora eskatzen duenez, oraingoan ez dute behar hori izango.



Oroitzen naiz gaztetan, FIFA 98 jolastean, komentaristek kriston hankasartzeak egiten zituztela: "jokoz kanpo pitatuko zuen baina ni ez nago horren ziur" (gaztelaniaz "habrá pitado fuera de juego pero yo no estoy muy seguro") esaten zuen komentaristetako batek, partida osoan jokoz kanpo bakar bat ere ez zegoenean. Gaur egungo egoera ez dakit nolakoa den, baina ez ninduke harrituko antzekoak ere gertatzea, eta konpondu bada, ziur aurretik grabatutako ahotsak erabiltzen jarraitzen dutela. Baina nola eman aurrerapausoak hemen kalitatea hobetzeko? Kirol jokoetan idealena komentarioak automatikoki prozesatzea litzateke, une horretan zehazki gertatzen ari denaren arabera jokoak komentarioa sortuz, eta gero software baten bidez ahotsa Loquendo eran (grazia gehiagorekin noski) prozesatuz. Ziur nago joko hauekin are gehiago gozatuko genukeela, esperientzia askoz ere hobea eginez.



Adibideekin amaitzeko, euskararako lan bat aipatu nahi dut, non morfologia konputazionala erabiltzen duten euskarazko Apalabrados bertsioa garatzeko. Horretarako, hitzen zerrenda bat erabiltzen dute oinarri gisa, eta tresna baten bidez arau batzuk ezarri, erabiltzaileak zehazten dituen hitzak zuzenak ote diren edo ez erabakitzeko: hitzen oinarrizko deklinazioa 22 modu desberdinetan, adjektiboen konparatibo eta superlatiboak, eta aditz bakoitzarentzat 24 forma desberdin, besteak beste.



Ikusten duzuenez, hizkuntzaren prozesamendu automatikoak potentzial handia dauka bideojokoen munduan, baina oraindik ez da potentzial hori behar bezain beste aprobetxatu. Zalantzarik gabe, etorkizunean asko aprobetxatuko da adimen artifizialaren alor hau, hala ere, oraindik ideiak falta dira, eta baldin badaude, hauek aplikatzeko ausardia. Adibide hauen ondoren, ziur nago zuei ere burura datorkizuela hizkuntza bideojokoetan aplikatzeko era desberdinak.

Artikuluarekin amaitzeko, hizkuntzaren prozesamenduan erlazionatutako master bat eskaintzen du Euskal Herriko Unibertsitateak, "Hizkuntzaren Azterketa eta Prozesamendua" deitua. Master hau Donostiako Informatika Fakultatean eskaintzen da, eta euskaraz edo ingelesez egin daiteke. Ingeniari eta hizkuntzalarientzat dago bereziki zuzendua, baina gai hauetan interesa duen edonor da ongi etorria. Anima zaitezte!!