<div dir="ltr"><div>Aupa!</div><div><br></div><div>Atzo batzordeko kide den Igor Leturiarekin hitz egiteko aukera izan nuen, Spectrum garaiko laguna dut azken urtetan gure jaioterriko maritxu kajoitan bakarrik ikusi arren. Berak ibilbide osoa egin du EABn eta nik nere burua kokatu nahi nuen joan aurretik. Datorren asteko bileran aurreko legealdian amaitu zen eta aurkezteke dagoen gomendioen bigarren liburua aurkeztuko dute. Txopi, bai, bertan CV aipatzen da eta gomendioen artean daudenak legealdia lagunduko diren proiektuak izaten dira.</div><div><br></div><div>CV lagundu edo bultzatzea erabakitzen badute bultzada horri nola forma eman argitu beharko da. (euskal wikipediarekin gertatu zen antzerako zerbait.)</div><div><br></div><div>Ez ditut hesgailuak urratuaren aurretik jarriko baina EUSKARAREN aholku batzordeak, aholkatu egiten du eta gero dagokionak euskararen etorkizuna oinarri zeri lagundu erabaki. Zeri eta nola lagunduko dioten urruti dago. kontu hauek ooosooo pooooliki doaz.</div><div><br></div><div>Euskal STT pribatu bat badago, elhuyarrena. Igorrek azaldu zidanez, beraiek ez dute 10 mila ordu ez inondik inora. <br></div><div><br></div><div>Ordu kopuru aldana hori ziur aski aldaera askotariko eta hitz kopuru handi bat ondo ulertzeko izango da. Seguru aski ingelesa oinarri eta bost kontinentetako azentu guztiak aintzat hartua egindako kalkulua izan daiteke, baina ez kasurik egin, nik Txopik baino askoz gutxiago baitakit STT hauei buruz.</div><div><br></div><div>"Aholkulari adituen" artean librezale bat gehiago (13ko zerrenda horietako hainbat badira eta) dago eta aldea azken honek hemen informatuko duela izango da, batipat.</div><div><br></div><div>izan libre izan euskaldun!</div><div><br></div><div>Ander.</div><div><br></div><div><br></div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Hau idatzi du Txopi , Librezale-en bidez (librezale@librezale.eus) erabiltzaileak (2021 mai. 3, al. (21:57)):<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">21/5/3 11:58(e)an, Joxan Garaialde , Librezale-en bidez igorleak idatzi<br>
zuen:<br>
> 2021/5/3 11:02(e)an, Gorka Azkarate Zubiaur , Librezale-en bidez<br>
> igorleak idatzi zuen:<br>
>> Kaixo:<br>
>><br>
>> EAEko Kultura Sailak STT motor bat, ahotsa testura transkribatzeko<br>
>> euskarazko motor bat, sortzeko egitasmoa oso interesgarritzat jotzea<br>
>> normala da. Kontrakoa izango litzateke kezkagarria, horrelako proiektu<br>
>> batez paso egitea.<br>
>><br>
>> Egitasmo hori Txopiren lidergoarekin abiatu zen, Librezale taldekide<br>
>> batzuen laguntza izan zuen, baina helmugaraino iristeko eta etorkizun<br>
>> hurbil batean kalitatezko STT motor bat egoteko, laguntza guztiak<br>
>> eskertu beharko.<br>
>><br>
>> Ez dakit EAEko Kultura Sailak zer proposatuko duen, pertsona bat<br>
>> proiektua sustatzeko kontratatzea, enpresa bati enkargua egitea...<br>
>><br>
>> Librezale taldeko edonor libre da, jakina, horrelako lanpostu batera<br>
>> aurkezteko, eta Txopik onartuko ez duen lanpostua onartzeko. Librezale<br>
>> taldekide batek onartuko balu lan hori, kontratu peko lana izango<br>
>> litzateke, ez Librezale taldekide baten lana. Horrelakorik, nik<br>
>> dakidala, lehenago ere gertatu zen, eta taldeak pozik hartu zuen<br>
>> pertsona batek taldeak boluntarioki egiten zuena kontratu pean egiten<br>
>> hastea. Baina pertsona horrek egiten zuena bere ardura pean egiten<br>
>> zuen, kontratu pean, eta, beraz, lan hori ez zen Librezale taldearen<br>
>> lana, pertsona horrena edo berak sortutako enpresarena baizik.<br>
>><br>
>> Librezale taldea boluntarioz osatuta dago eta lan boluntarioa egiteko<br>
>> sortu zen. Eta EAEko edo Nafarroako Gobernuko Kultura Sailakoak<br>
>> horretan ere ibiltzea, edo ez ibiltzea, Librezale taldearen<br>
>> ahalmenetatik kanpo geratzen da.<br>
>><br>
>> Pertsona bakar batek, astean 35 orduz-edo liberatuta, asko bultza<br>
>> dezake Common Voice bezalako proiektu bat. Agian Librezale taldeko<br>
>> boluntario guztiek beste. Ardura hori hartuko duen pertsonaren<br>
>> arabera, eta bere uneko egoeraren arabera...<br>
>><br>
>> EAEko Kultura Sailakoek egingo dutena edo egingo ez dutenarekin<br>
>> gehiegi kezkatu barik, Librezale taldeak Common Voice proiektua<br>
>> sustatzen segitzea espero dut. Nik, hirugarren errenkadatik, zerbait<br>
>> egiterik badut, laguntzen saiatuko naiz. Esaldi bakar batzuk grabatzen<br>
>> edo balioesten besterik ez bada ere.<br>
>><br>
>> Ondo izan,<br>
>><br>
>> Gorka Azk.<br>
><br>
> Gaia dela eta, ni ere prest nengoke Gorkak e-posta honetako azken<br>
> paragrafoan dioenaren bidetik laguntzeko: "Nik, hirugarren errenkadatik,<br>
> zerbait egiterik badut, laguntzen saiatuko naiz. Esaldi bakar batzuk<br>
> grabatzen edo balioesten besterik ez bada ere".<br>
><br>
> Ongi izan.<br>
><br>
> Joxan Garaialde<br>
><br>
<br>
Kaixo:<br>
<br>
Eskerrik asko bioi eskaintzagatik. Hirugarren lerroan bada ere denon<br>
ekarpenek gehitzen dute! :-)<br>
<br>
Badaezpada, gauza bat argitu nahi dut. Kultura Sailak Common Voice<br>
lagunduko balu, CC0 lizentziadun esaldi-sortaren bilketan izango zen eta<br>
herritarrak grabaketak egiten animatzen. Datu horiekin Mozillak sortu<br>
nahi duen Deep Speech STT motor librean ez zen sartuko, nik behintzat ez<br>
dut inorekin hitz egin aukera horretaz. AEBk proposatuko duena EJk datu<br>
bilketan laguntzea izango da, izan ere hori ere bada Common Voice<br>
proiektuaren helburua.<br>
<br>
Euskaraz dakien STT motor libre bat (edo gehiago) lortzea nola edo hala<br>
helduko den zerbait dela uste dut, baina denbora gehiago beharko da<br>
horretarako lehenik eta behin datu andana behar delako eta ez dago atzo<br>
azaltzen saiatu nintzen balizko proiektu horren barruan. Gauza batek<br>
zeharka agian beste lagunduko luke, baina auskalo.<br>
<br>
Bida batez, atzo ahaztu zitzaidan aipatzea nik dakidanaren arabera STT<br>
ereduak progresiboak direla, hau da datu gutxirekin hitz sorta txikiak<br>
desberdintzeko ereduak trebatu daitezke (ez/bai,<br>
zero/bat/bi.../bederatzi, eta abar) eta datu askorekin sorta handiagoak.<br>
Beraz, ez da dena 2.000 ordu lortzen ditugunean edo ezer ez bitartean,<br>
baizik eta zenbat eta grabaketa gehiago balioztatu eta ereduak<br>
trebatzeko erabili, orduan eta erabilgarriagoak/jeneralistagoak diren<br>
ereduak lortzen direla. Hori da behintzat nik ulertuta daukadana.<br>
Hizkuntza-teknologietan nik baino gehiago dakien norbaitek (ez da bat<br>
ere zaila arlo honetan nik baino gehiago jakitea!), azalpena baieztatu<br>
edo osatu badezake, aurrera mesedez :-)<br>
<br>
Ondo izan,<br>
Txopi.<br>
_______________________________________________<br>
Librezale mailing list<br>
Librezale@librezale.eus<br>
<a href="https://librezale.eus/cgi-bin/mailman/listinfo/librezale" rel="noreferrer" target="_blank">https://librezale.eus/cgi-bin/mailman/listinfo/librezale</a><br>
</blockquote></div>