[Librezale] Common Voice estatistikak

Txopi txopi a bildua ikusimakusi.eus
Al, Maiatza 3, 22:31:45, CEST 2021


21/5/2 20:43(e)an, Porrumentzio , Librezale-en bidez igorleak idatzi zuen:
> Nik pentsatze nun juxtu grabatutato audioak onartzeko behar zala jende
> gehien, horreatik enaiz ibili grabatzen, baƱo benetan behar bada
> grabatu, gustoasko ingo det!

Gauza biak behar dira. Oreka mantentzeko grabatzen duzun bikoitza
balioztatzea gomendatzen da (10 grabatu, 20 balioztatu), baina ekarpen
oro ongi etorria da!

> 
> Sortu izan zaiten beste zalantza bat hizkera da: nere hizkera, ahoskera
> ta euskalkiakin o batu-ofizialakin?

Fonetikoki h, j eta abar ahoskatzeko duzun era zure zonaldekoa izango
da. Beraz, zentzu horretan lasaitasunez irakur ditzakezu aurkezten
zaizkizun esaldiak.

Euskalkiz aldatzea berriz ez da egokia. Pantailan hau agertzen bada
"Nire etxea dela zekien", ezin duzu irakurri "Nere etxea dala zekin",
"Neure etxia dala ekixen" ez bestelakorik. Etorkizunean euskalkietan
dauden esaldiak bildu litezke, euskalki horretako hiztunek erosoago egin
ditzaten grabaketak edo horrelako zerbait, baina oraingoz nahikoa
buruhauste ditugu euskara batuan dauden esaldiak biltzen.

Kontuan izan fonemak trebatzea dela helburua. "Nire"ak "nere" ahoskatzen
dituzten grabaketak balioztatuz gero, trebaketa fasean adimen
artifizialak okerreko ondorioak atera litzake eta norbaitek "Hernani"
ahoskatuz gero gerta liteke "Hernane" transkribatzea STT motorrak.

Ondo izan,
Txopi.


Librezale posta zerrendari buruzko informazio gehiago