[Librezale] Gaitu proiektuaren corpusa

Txopi txopi a bildua ikusimakusi.eus
As, Abu 1, 18:59:53, CEST 2023


Kaixo, Edurne:

Pozten naiz zu ezagutzeaz. Lehenik eta behin barkamenak eskatu nahi 
dizkizut hain berandu erantzuteagatik. Hau posta-zerrenda publiko bat da 
eta zure mezua moderatzeko zain egon da orain arte! Aurrerantzean adiago 
egongo naiz komunikazioan atzerapenik egon ez dadin.

Librezaleko kideetako bat naiz. Common Voice ekimenak hizkuntzen aldaera 
desberdinen proiektuak sortzea eta aurrera eramatea sustatzen du. Horrek 
baina lan asko suposatzen du hizkuntza berri bat bezala sortu behar 
baita: webgunea itzuli, idatzizko esaldiak kargatu, grabazioak egin eta 
balioztatu... Hau da, orain arte egin den lana berriz egin beharko 
litzateke (baita bizkaiera edo beste euskalki bat nahi izanez gero). 
Beraz, esaldiak itzultzearekin ez da nahikoa.

Jakizu ere proiektua orain dagoen moduan esaldi-sorta bakarra duela 
baina erregistratzen diren erabiltzaileek beraien azentua zehazteko 
aukera dutela (pantailan agertzen zaizkien hitzak irakurri behar dituzte 
baina desberdintasun fonetikoko batzuk egongo direla jakina da):
   - Mendebaldekoa (Araba, Bizkaia, Gipuzkoako mendebaleko herri batzuk)
   - Erdialdekoa edo Nafarra (Gipuzkoa, Nafarroa)
   - Nafar-lapurtarra edo Zuberotarra (Lapurdi, Nafarroa Beherea, Zuberoa)

Honi buruzko informazio pixka bat gehiago aurki dezakezu web orrialde 
honen hasieran:
https://commonvoice.mozilla.org/eu/guidelines

Nahi baduzu, jar zaitez nirekin harremanetan eta Nafarroako euskara 
batuan egin beharko liratekeen lanak zeintzuk diren azalduko dizut. 
Besteak beste gaitu.eus-en ere bigarren botoi bat jarri beharko 
litzateke nafarrerazko grabazioak dagokion lekuan gorde daitezen.

Idatzizko corpusak hemen daude deskargagarri (61.305 esaldi):
https://github.com/common-voice/common-voice/tree/main/server/data/eu

Eusko Jaurlaritzak 100.000 esaldi inguru dituen corpus bat gehituko du 
oker ez banago EiTB-tik lortutako testuekin osatua, baina oraindik ez du 
egin (fitxategi hori beraiek dute, oraindik ez dute Mozillak onartzea 
eta argitaratzea lortu).

Zure zalantzetako batzuk argitu izana espero dut.

Ondo izan,
Txopi.

23/7/18 10:31(e)an, Arrizibita Perez, Edurne (Euskarabidea), 
Librezale-en bidez igorleak idatzi zuen:
> Egun on, Nafarroako Gobernutik idazten dizuegu, Euskarabidea-Euskararen 
> Nafar Institututik hain zuzen ere, Gaitu Common Voice proiektuaren 
> sustapena Eusko Jaurlaritzarekin eta Euskararen Erakunde Publikoarekin 
> elkarlanean egiten ari garelako.
> 
> Nafarroan gu arituko gara promozio lan hori egiten eta gustatuko 
> litzaiguke jakitea proiektuaren corpusa eskuratzerik ba ote dagoen, 
> Nafarroako euskara batura moldatu ahal izateko.
> 
> Oker ez bagara, zuek arduratzen ari zarete, ezta? Posible litzateke 
> testuak geureganatzea?
> 
> Esanen diguzue.
> 
> Esker mila aunitz!!
> 
> *Edurne Arrizibita Perez***
> 
> *Euskararen Sustapenaren eta Plangintzaren****teknikaria *
> 
> Técnica de Planificación y Promoción del Euskera
> 
> /Telefonoa: 848 42 60 71/
> 
> *Euskarabidea*
> 
> Paulino Caballero, 13 -31002 Iruñea/Pamplona
> 
> http://www.euskarabidea.es/euskara <http://www.euskarabidea.es/euskara>
> 
> 			
> 		00. LOGO EUSKARABIDEA®
> 	Nahi baduzu, nirekin euskaraz
> 
> 
> 
> _______________________________________________
> Librezale mailing list
> Librezale a bildua librezale.eus
> https://librezale.eus/cgi-bin/mailman/listinfo/librezale


Librezale posta zerrendari buruzko informazio gehiago