[Librezale] Proiektu berria: Common Voice

Txopi txopi a bildua ikusimakusi.eus
Lar, Urr 20, 16:21:30, CEST 2018


lr., 2018.eko urrren 20a 12:38(e)an, Txopi igorleak idatzi zuen:
[...]
> Nire helburua, lagundu nahi duten Librezaleko kideekin batera, Common
> Voicen euskara aurrera eramatea da. Horretarako, behar dugun lehengo
> gauza CC0 lizentzia duen edo *jabetza publikoan dagoen liburu bat* da.
> Euskara batuan dagoen eta digitalizatuta dagoen horrelako testu luzerik
> ezagutzen du inork? Betekizunen inguruko zehaztasun gehiago beherago.

Norbaiti zalantza sortu baldin bazaio, argitu nahi dut jabetza publikoan
dauden lanak erabil daitezkeela egilea aipatu gabe eta horregatik CC BY
eta beste lizentzia asko dituzten lanak kanpo geratzen direla. Beraz,
lizentzia CC BY-SA lizentzia librea duten iturriak ezin ditugu erabili:
Euskarazko Wikipedia, Berria.eus, Argia.eus, Zuzeu.eus, Sustatu.eus,
Goiena-eus, Sarean.eus. CC BY lizentzia duen Tatoeba.org-eko edukiak ere
ez. Forvo.com are gutxiago ez baitu lizentzia librerik (CC BY-NC-SA).

Txatean aipatu den bezala, nire bloga (ikusimakusi.eus) CC0
lizentziaduna da, baina esan beharra dut nire ustez ez dituela bilatzen
ditugun betekizunak betetzen, hainbeste ere ez dudalako bertan idatzi
euskaraz, gehienetan teknologia zuzenean ez bada zeharka dudalako
mintzagai eta hizkuntzaren esparru batzuk ez ditudalako inoiz aipatzen:
kirola, natura... Beraz, bertatik zer edo zer berrerabili genezake,
baina nire ustez beste iturri potolo bat behar genuke dugun helbururako
egokia den datu-sorta lortzeko.

Gogoratu hitz-zerrendek ere ez dutela balio, ahotsaren ezagutzaren kontu
hau ondo egiteko esaldiak ahoskatzean nola intonatzen ditugun
interesatzen baitu. Hau da, "zure etxe ondoan" ahoskatzean, "zure" eta
"etxe" hitzen azken silaba goranzko intonazioarekin ahoskatzen dugu. Eta
solte irakurriz gero, beheranzko intonazioarekin. Ez nago honetaz ziur,
baina uste dut horregatik eskatzen dituztela 5-10 hitz dituzten esaldiak
eta espresuki eskatzen dutela ez biltzeko hitz solteen zerrendarik. Hala
ere, hitz gutxiko esaldiak ere egon egon badaudenez ("Kaixo", "Agur",
"Eskerrik asko"...) horiek ere bildu ditzakegu, neurrian baldin bada.

Txatean azken minutuetan erabil genitzakeen beste iturri batzuk ere
aipatu dira:
- Intza proiektua. Euskal lokuzioak sarean:
https://intza.armiarma.eus/info.htm
- Gotzon Garateren atsotitzen bilduma:
http://ametza.com/bbk/htdocs/garate.htm
- Euskarazko Wikipediako euskal abesti herrikoen letrak:
https://eu.wikipedia.org/wiki/Kategoria:Euskal_abesti_herrikoiak
- Euskarazko Wikiesanakeko atsotitzak:
https://eu.wikiquote.org/wiki/Kategoria:Atsotitzak

Aztertu beharko berauok benetan erabil ditzakegun, nola nahi ditugun
erabili eta abar. Oraintxe bertan lizentzia egokia ez duten baina
interesgarriak liratekeen beste zenbait iturri ere aipatu dira.

Ondo izan,
Txopi.


Librezale posta zerrendari buruzko informazio gehiago