[Librezale] Common Voice EAB eta Kultura Saila

Txopi txopi a bildua ikusimakusi.eus
Iga, Maiatza 2, 21:05:52, CEST 2021


Kaixo:

Dakizuen bezala, urte batzuk daramatzat Mozilla fundazioaren Common
Voice proiektuan sartuta. Librezalen proiektua proposatu eta aurrera
egin nuen. Zorionez Librezaleko hainbat kide proiektura batu eta guztion
artean lan ederra egin dugula uste dut. Ez hori bakarrik, beste hainbat
bildu zitzaizkigun bidean eta nola edo hala beraien ekarpenak egin:
https://librezale.eus/wiki/CommonVoice#Eskerrak

Ahotsa testura transkribatzeko (STT) kalitatezko euskarazko motor bat
sortzeko hainbat datu behar dira: euskarazko esaldiak eta hainbat
hiztunek esaldiok grabatzea. Guk proiektua hasi genuen lan kolosala zela
jakinez, helburua ikaragarri urrun bazegoela eta haraino nola demontre
helduko ginen jakin gabe. Baina lehen urratsak eman genituen eta martxan
hasi ginen. Denborarekin esaldi gehiago lortu genituen (Argiarenak,
Wikipediarenak) eta komunikazio kanpaina batzuei esker mila hiztun
mobilizatzea lortu genuen eta hamar segundoko grabaketatxoak eginez
denon artean 130 ordu grabatzea lortu dugu (hauetatik batzuk oraindik
balioztatu gabe daude, baina tira). Nire ustez lan bikaina egin dugu,
ohi bezala auzolanean eta elkar lagunduz, modu asanblearioan eta
horizontalean. Lortutakoaz arro egon gaitezkeela uste dut.

Orain, beste urrats bat eman beharko genukeela uste dut: esaldi gehiago
bildu eta grabaketa gehiago lortu. Nola? Nor dago horretan laguntzeko
prest? Nik ordu asko eman ditut kontu hauetan eta azkenaldian beste
proiektu batzuetan zentratuta nago. Hala ere, jendea animatuz gero, ni
laguntzeko prest nago.

Argiaren webgunetik 3.900 esaldi atera genituen[1], baina ez genuen
beraien fondo guztia erabili. Beraiekin hitz eginez gero, esaldi gehiago
atera genitzakeela uste dut. 10-15 hitz dituzten esaldiak bakarrik
hartzen ditugunez eta gero denak nahastu, hainbat hedabiderekin eta
iturrirekin hitz egiterik dagoela uste dut, testu originalak
berreskuratzea ezinezkoa denez, proiektu honetarako lagapenak lortuz:
Berri, Hitza... aukera asko leudeke norbaitek horretan lan egiteko
denbora aterako balu.

Proiektu honekin hasi ginenetik egin dugun zaratari esker eta proiektuak
berak dituen helburu interesgarriei esker, Euskararen Aholku Batzordeko
ingurune digitalekoek lagundu nahi lukete esan zidaten (gure Ander
Elortondo sartu berri da talde horretan hain justu). EABk prestatuko
dituen hurrengo aholku-sortan Common Voica agertuko balitz, Eusko
Jaurlaritzak ere (Kultura Sailak) Mozillaren Common Voice proiektu
honetan lagundu lezake. Gurekin egin nahi lukete bide hori, Librezaleri
diruren bat emanez edo horrelako zerbait, baina nik argi dudanez guk
Soft Catalaren bidean interesik ez dugula eta gure bidea oso argi
zehaztu dugula, galdetu zidatenean maila pertsonalean laguntzea eskaini
nien. Hala, EABko ingurune digitaleko batzordeko arduradunari, Maite
GoƱiri, Mozillak mundu mailan abiatutako Common Voice proiektua zertan
datzan eta zeintzuk lan eta behar dauden azaldu nizkion. Eusko
Jaurlaritzak hedabideekin hitz eginez edo berak dituen biltegien
bitartez, esaldiak lortu eta prestatu ahal izango balitu, primeran.
Prestaketa lanak egiteko eta esaldiak igotzeko norbait kontratatu nahiko
balu (nik ez dut horrelakorik egingo, nire lan arruntarekin nahikoa eta
sobera dudalako), positiboa ikusten dut. Zenbat eta esaldi gehiago
askatu proiektu honetarako hobeto, beste hainbatek ere erabiliko
dituztela jakinik (txatean jakin dugun bezala, badira ikertzaileak
euskara batuan dauden CC0 lizentziadun testuak primeran datozkienak).
Zer iruditzen?

Aukera bat baino ez da, EABk aholku hori prestatuko duela uste dut eta
ikusiko da aurrera ateratzen den ala ez. Esaldi andana lortuz gero,
grabaketa gehiago egiteko unea helduko da. Esaldi asko gehiago kargatzen
baditugu, ereduan kalterik egin gabe nahi beste grabaketa gehiago
egiteko eran egongo ginateke. Niri pertsonalki Euskaraldia aprobetxatuz
deialdi handi bat egitea gustatuko litzaidake. Aurrekoan egin genuen
(txioren bat edo idatzi genuen xDD), baina Mozillaren proiektu honetan
Euskaltzaleen Topagunea bera edo laguntzeko prest izatea lortuko bagenu,
esaldi mordoxka horretarako grabaketa mordoxka bat lortu genezake agian...

Ez dakit guzti hau esne saltzailearen ipuinean bezala ezerezean geratuko
ote den, baina zuek denok informatu nahi zintuztedan. Bilera pare batean
egon naiz eta maila pertsonalean nire laguntza eskaini dut. Librezale
urrats berri horien parte izatea nahi nuke eta benetan zerbait egingo
bada azkenean (baliteke ezer ez egitea), Librezaleren logoa, partaidetza
edo dena delakoa nola zehaztu eztabaidatu ahal izango genuke. Inolaz ere
gure printzipioen aurka joan gabe eta behar hori sentitu gabe. Azken
finean, guk ekarri dugun proiektua da eta guri esker heldu gara heldu
garen lekuraino. Eta proiektu mastodontiko honek agente gehiago behar
baditu ere, Mozillaren ekimen horretara batzen direnek guri aitortza
egin nahi izatea logikoa ikusten dut, gurekin elkarlanean aurrera egin
nahia ere (azken hori oso zaila ikusten dudala argi utzi dut, ezinezkoa
ez esateagatik).

Besterik gabe. Ez dakit ondo azaldu ote naizen baina saiakera egin dut.
Ea datozen hilabeteetan Anderren bidez edo nire bitartez zerbait berria
kontatzeko dagoen. Hala ez bada, gurearekin jarraitzea pentsatzen joan
gintezke: grabaketa gehiago, zain dauden grabaketa balioztatu, esaldi
gehiago iturriak eta prestaketak...

Inork zalantzarik badu, galde diezadala ohi bezala gure txatean edo
posta-zerrenda honetantxe :-)

[1] https://librezale.eus/wiki/CommonVoice

Ondo izan,
Txopi.


Librezale posta zerrendari buruzko informazio gehiago