<div dir="ltr">Aupa Lierni eta Osoitz!<div><br></div><div>Milesker hain azkar erantzuteagatik.</div><div><br></div><div>Esan duzun moduan badaude iada <i>en-eu</i> korpus batzuk eskuragarri sarean, adibidez, GNOME. Beste korpus gutxi batzuk ere aurki daitezke <a href="http://opus.lingfil.uu.se/index.php" target="_blank">OPUS</a> webgunean. Begiratu diegu horiei pixka bat eta uste dugu esaldiak laburrak eta nahiko simpleak direla, eta beraz, Googlek iada horrelako esaldiekin nahiko lan ona egiten duela. Horregatik, <a href="http://www.statmt.org/wmt16/" target="_blank">WMT</a> lehiaketan aurkezten diren moduko korpus txiki bat sortu nahi dugu. Aukeratu ditugun esaldiak bataz-beste 22 hitzeko luzera dute eta esaldi konplexuak dira.</div><div><br></div><div>Gure helburua ez da Google erabiltzea, baizik eta Google baino itzultzaile hobe bat sortzea. <a href="http://opennmt.net/" target="_blank">OpenNMT</a> izeneko tresna bat erabiltzen hasi gara. Software librea da eta barruan guk nahi ditugun aldaketak egitea ahalbidetzen digu. Baditugu ideia batzuk buruan existitzen diren NMTak hobetzeko, eta horietako bat, Googlek erabat zehatz itzuli gabeko esaldiak nolabait aprobetxatzea da.</div><div><br></div><div>Dena dela, hilabete daramagu honetan lanean eta lehenengo ikerketan ez dugu sistemaren arkitekturan berrikuntza handirik proposatuko. OpenNMTren burutzea aztertuko dugu eta gero hasi hura hobetzen. Horretarako sortu nahi dugu esaldi luzeen korpus bat. Agian, iada existitzen diren beste korpusak ere erabiliko ditugu (PaCo_EnEu, GNOME...<span style="font-size:12.8px"> ), nahiz eta esaldi laburragoak izan, eta esaldien luzeraren araberako analisi bat egin.</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Amaitzeko, zuei hobe iruditzen zaizuen plataformarekin ados nago. Horri buruz zuek gehiago dakizue. Ideala abuztu amaierarako korpusa prest izatea izango litzateke. Bitartean PaCo_EnEu korpusarekin ari naiz lanean.</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Laster arte,</span></div><div><span style="font-size:12.8px">Inigo Jauregi Unanue</span></div></div><div class="gmail_extra"><br><div class="gmail_quote">2017-08-02 23:22 GMT+10:00 Lierni GARMENDIA ARRATIBEL <span dir="ltr"><<a href="mailto:lierni.garmendia@jakintza.net" target="_blank">lierni.garmendia@jakintza.net</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div><div><div>Kaixo berriro!<br><br></div>Bai, ezta? Iñigo nirekin harremanetan jarri zenean ez nuen bi aldiz pentsatu eta lagunduko niola esan nion!<br><br></div>Kontua da ez dela lokalizazioa berez, corpus baten itzulpena baizik, eta nahiko zabala. Horregatik proposatzen nuen itzulpen proiektu ireki bat sortzea itzulpengintzarako crowdsourcing plataforma batean eta gero ahalik eta itzultzaile gehien lortzea, itzultzaile
bakoitzak gutxiago itzultzeko.<br><br></div>Iñigok bidali didan materiala jarraibideak eta hiru .csv fitxategi dira, Calc-ekin ireki beharrekoak. Hiru zutabe dituzte: ingelesezko jatorrizko esaldien zutabea, Google-ren euskarazko itzulpenen zutabea eta euskarazko esaldi zuzena idazteko zutabea. Hiru .csv fitxategiekin proiektu ireki bat sortzerik bagenu itzulpengintzarako crowdsourcing plataforma batean...<br><br></div>Zer iruditzen zaizue? Egin daiteke?<br><br></div><div>Zure zalantzari dagokionez, oraintxe idatziko diot Iñigori, agian ez baitu aztertu aukera hori. Helaraziko dizuet bere erantzuna erantzuten didanean.<br></div><div><br></div>Lierni<br> </div><div class="gmail_extra"><span class=""><br clear="all"><div><div class="m_-1366680876988989741gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><b>Lierni Garmendia</b><br><i>EU/ES, EN, DE, CA > ES/EU Itzultzailea<br></i></div><div><i>Zuzentzailea<br></i></div><div><i>Hizkuntz irakaslea<br></i></div></div></div></div></div></div></div>
<br></span><div class="gmail_quote">2017-08-02 14:35 GMT+02:00 Osoitz E <span dir="ltr"><<a href="mailto:oelkoro@gmail.com" target="_blank">oelkoro@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div>Aupa Lierni,<br><br>Niri ideia orokorrean oso interesgarria iruditzen zait, denok amestu dugu itzulpenak egiterako orduan lan astunena kenduko digun tresnaren bat.<br><br></div>Aipatzen duzun itzulpen proiektu horrentzat, proiektua software librea bada, Crowdin, Transifex edo hosted.weblate bezalako zerbitzari batean jartzea dago, beste aukera bat weblate softwarea norberaren zerbitzari batean instalatzea da. Librezalek badu Pootle instalazio bat, baina zaharkituta dago, ez dugu erabiltzen, eta ez eguneratzea erabaki zen Pootle bertsio berriak mantentzeko oso konplexuak omen direlako, aurreko astean pribatuan apur bat hitz egin genuen gutariko batzuk Weblate softwarea Librezaleren zerbitzarian instalatzeari buruz, baina oraindik ez dugu egiaztatu posiblea den ezta zerrendan eztabaidatu.<br><br></div>Zalantza bat ere badut, Googlek egindako itzulpen automatikoak eskuz egindako itzulpenekin konparatzea bada helburua, zergatik ez egin alderantziz? Itzulpen okerrak zuzendu ordez, jada orokorrean ontzat ematen den itzulpen bat hartu, demagun GNOME eta kate horiek guztiak Googlei itzultzea eskatu.<br><br></div>Osoitz<br><div><div><div><div><br></div></div></div></div></div><div class="gmail_extra"><br><div class="gmail_quote">Lierni GARMENDIA ARRATIBEL<span dir="ltr"><<a href="mailto:lierni.garmendia@jakintza.net" target="_blank">lierni.garmendia@jak<wbr>intza.net</a>></span> igorleak hau idatzi zuen (2017(e)ko abuztua 2 09:32):<div><div class="h5"><div><div class="m_-1366680876988989741h5"><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div><div><div><div>Egun on guztioi!<br><br></div>Lehenik eta
behin, partekatu nahi nuen asko poztu ninduela LibreOffice 5.4
argitaratu zutela eta euskaraz ere bazetorrela irakurtzeak. Zorionak,
Librezale!<br><br></div>Abuztuko proiektuari dagokionez, ea zer
iruditzen zaizuen nire proposamena. Ezberdina da, baina euskal
komunitatearentzat eta Librezalerentzat oso interesgarria eta
etorkizunean oso erabilgarria izan daitekeela iruditzen zait.<br><br></div>Iñigo
Jauregi Sydneyko Unibertsitatean doktoretza-ikerketa bat egiten ari den
gazte euskalduna da. Telekomunikazio-ingeniaria da bera, baina
ingelesa-euskara itzulpen automatiko neuronala (Neural Machine
Translation, NMT) ari da ikertzen orain, eta horregatik jarri da
harremanetan nirekin: lehendik dagoen ingelesa-euskara corpusa txikiegia
da eta zabaldu egin nahi du itzultzaile automatikoa entrenatzen
hasteko, eta, horretarako, corpus bat prestatu du eta ingelesetik
euskarara itzuli nahi du. Zer iruditzen zaizue? Laguntzeko prest
zaudete? Abuztuko proiektua ez bada, laguntzeko prest dago inor?<br><br></div><div>Nik hau pentsatu dut: Itzulpen proiektu bat sortu
itzulpengintzarako crowdsourcing plataforma batean, zeinak itzulpen
memoria (TM) komun bat eta glosategi komun bat sortzea eta elikatzea
ahalbidetzen duen. Horrela, errazagoa, azkarragoa eta koherenteagoa
izango da itzulpena, eta egokiagoa corpusa, bere ikerketarako. Gero,
ahalik eta itzultzaile gehien lortu beharko genituzke, itzultzaile
bakoitzak gutxiago itzultzeko.<br></div><div><br></div>Atxikita bidaltzen dizuet pasatu didan dokumentua. Bertan aurkituko dituzue proiektuaren inguruko xehetasunak.<br><br></div>Zuen erantzunaren zain geratzen naiz,<br><br></div>Lierni</div><div class="gmail_extra"><br clear="all"><div><div class="m_-1366680876988989741m_-6579559316925499239m_-6403104951220391005gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><b>Lierni Garmendia</b><br><i>EU/ES, EN, DE, CA > ES/EU Itzultzailea<br></i></div><div><i>Zuzentzailea<br></i></div><div><i>Hizkuntz irakaslea<br></i></div></div></div></div></div></div></div><div><div class="m_-1366680876988989741m_-6579559316925499239h5">
<br><div class="gmail_quote">2017-08-01 18:58 GMT+02:00 Asier Sarasua Garmendia <span dir="ltr"><<a href="mailto:asier.sarasua@gmail.com" target="_blank">asier.sarasua@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">ar., 2017.eko aburen 01a 13:39(e)an, Osoitz E igorleak idatzi zuen:<br>
<span>> Aupa,<br>
><br>
> Hilabeteko proiektua bizirik mantendu da, beraz, jarrai dezagun...<br>
><br>
> Ni Riot itzultzen hasi naiz, hori jarri dezakegu proiektu gisa edo<br>
> ohiko eztabaida eta bozketa egin.<br>
><br>
> Zer diozue?<br>
<br>
</span>Nik ez dut askorik egingo abuztuan, LibreOffice laguntzaren itzulpena<br>
bukatzea ez bada; beraz nire partetik, zuk nahi duzuna.<br>
<br>
Nik beste proiektu bat dut begiz jota: LMMS[1]. Hurrengo baterako.<br>
<br>
Asier.<br>
<br>
[1]<a href="https://lmms.io/" rel="noreferrer" target="_blank">https://lmms.io/</a><br>
<br>
______________________________<wbr>_________________<br>
Librezale mailing list<br>
Librezale@librezale.eus<br>
<a href="https://librezale.eus/cgi-bin/mailman/listinfo/librezale" rel="noreferrer" target="_blank">https://librezale.eus/cgi-bin/<wbr>mailman/listinfo/librezale</a><br>
</blockquote></div><br></div></div></div>
<br>______________________________<wbr>_________________<br>
Librezale mailing list<br>
Librezale@librezale.eus<br>
<a href="https://librezale.eus/cgi-bin/mailman/listinfo/librezale" rel="noreferrer" target="_blank">https://librezale.eus/cgi-bin/<wbr>mailman/listinfo/librezale</a><br>
<br></blockquote></div></div></div></div></div><br></div><div><div class="h5">
<br>______________________________<wbr>_________________<br>
Librezale mailing list<br>
Librezale@librezale.eus<br>
<a href="https://librezale.eus/cgi-bin/mailman/listinfo/librezale" rel="noreferrer" target="_blank">https://librezale.eus/cgi-bin/<wbr>mailman/listinfo/librezale</a><br>
<br></div></div></blockquote></div><br></div>
</blockquote></div><br></div>