Common Voice proiektua testua

Librezale.eustik
Hona jauzi: nabigazioa, bilatu

Common Voice, Mozilla fundazioak, makinei ahots naturala erakusteko proiektua da. Ahots teknologia hau gainera, guztion eskura jartzeko asmoa dute eta ziurrenik laster, gero eta ohikoagoak bilakatzen ari zaizkigun gailu ezberdinek (mugikorretako ahotsezko bilatzaileek adibidez) erabiltzeko aukera izango dute.

Teknologia libre hau sortzeko ahaleginean baina, pauso bat aurrerago eman dute eta orokorrean enpresa handiek egin ohi ez duten moduan, hizkuntza handiak ez diren beste hizkuntza batzuk ere sartu dituzte tarteko, euskara kasu, Librezaleren aterkipean.

Makinei euskara irakasteko baina, ahots grabaketa asko behar dira eta grabaketa hauek taxuz egin ahal izateko formatu jakin bateko idatzizko esaldiak. Lanketa hau egin behar izan da, hainbat iturritatik esaldiak lortuz eta egokituz. Garrantzia berezia izan dute lanketa honetan Argia hedabideak eskura jarritako testu libre guztiek.

Common Voice proiektua beraz, eduki libreetatik sortutako eta guztion eskura jarri asmo duen teknologia librea izateko funtsarekin sortu da.

Kalitatezko ahots datu sorta bat sortzeko beraz, aurrez landutako esaldi mordo guzti horiek guztion eskura jarri dituzte gu pertsonok irakurri eta balioztatzeko. Esaldi asko dira eta pertsona askoren artean grabatu eta berrikusi beharko dira. Bakoitzaren ñabardurak, azentoak etabar makinek ondo ikas ditzaten.

Beharrezkoa izango da gailu ezberdinetatik grabatzea eta baita euskara ezberdina darabilten pertsonek egitea ere. Gainera, norberak profil txiki bat betetzeko aukera izango dugu hainbat datu esanguratsu ere kontutan izan ditzaten (adina, sexua, azentua...).

Ahots datu libreak sortzea oso modu errazean eta web bidez egiteko aukera dago. Bosnaka aurkezten dizkiguten esaldi sortak irakurri edota baieztatu, onartu beharko ditugu. Guztira 5000 baliozko grabaketa lortzea izango da helburua eta beste XXX orduko grabaketak lortzea.

Guztiok grabaketa batzuk eta beste balidazio gutxi batzuk eginez lor dezagun bada gure hizkuntzarentzat horren beharrezko eta funtsezkoa izango den datu bilketa libre bat.