[Librezale] Abuztuko proiektua?

Inigo Jauregi ijauregi a bildua cmcrc.com
Ast, Abu 3, 03:25:47, CEST 2017


Aupa Lierni eta Osoitz!

Milesker hain azkar erantzuteagatik.

Esan duzun moduan badaude iada *en-eu* korpus batzuk eskuragarri sarean,
adibidez, GNOME. Beste korpus gutxi batzuk ere aurki daitezke OPUS
<http://opus.lingfil.uu.se/index.php> webgunean. Begiratu diegu horiei
pixka bat eta uste dugu esaldiak laburrak eta nahiko simpleak direla, eta
beraz, Googlek iada horrelako esaldiekin nahiko lan ona egiten duela.
Horregatik, WMT <http://www.statmt.org/wmt16/> lehiaketan aurkezten diren
moduko korpus txiki bat sortu nahi dugu. Aukeratu ditugun esaldiak
bataz-beste 22 hitzeko luzera dute eta esaldi konplexuak dira.

Gure helburua ez da Google erabiltzea, baizik eta Google baino itzultzaile
hobe bat sortzea. OpenNMT <http://opennmt.net/> izeneko tresna bat
erabiltzen hasi gara. Software librea da eta barruan guk nahi ditugun
aldaketak egitea ahalbidetzen digu. Baditugu ideia batzuk buruan existitzen
diren NMTak hobetzeko, eta horietako bat, Googlek erabat zehatz itzuli
gabeko esaldiak nolabait aprobetxatzea da.

Dena dela, hilabete daramagu honetan lanean eta lehenengo ikerketan ez dugu
sistemaren arkitekturan berrikuntza handirik proposatuko. OpenNMTren
burutzea aztertuko dugu eta gero hasi hura hobetzen. Horretarako sortu nahi
dugu esaldi luzeen korpus bat. Agian, iada existitzen diren beste korpusak
ere erabiliko ditugu (PaCo_EnEu, GNOME... ), nahiz eta esaldi laburragoak
izan, eta esaldien luzeraren araberako analisi bat egin.

Amaitzeko, zuei hobe iruditzen zaizuen plataformarekin ados nago. Horri
buruz zuek gehiago dakizue. Ideala abuztu amaierarako korpusa prest izatea
izango litzateke. Bitartean PaCo_EnEu korpusarekin ari naiz lanean.

Laster arte,
Inigo Jauregi Unanue

2017-08-02 23:22 GMT+10:00 Lierni GARMENDIA ARRATIBEL <
lierni.garmendia a bildua jakintza.net>:

> Kaixo berriro!
>
> Bai, ezta? Iñigo nirekin harremanetan jarri zenean ez nuen bi aldiz
> pentsatu eta lagunduko niola esan nion!
>
> Kontua da ez dela lokalizazioa berez, corpus baten itzulpena baizik, eta
> nahiko zabala. Horregatik proposatzen nuen itzulpen proiektu ireki bat
> sortzea itzulpengintzarako crowdsourcing plataforma batean eta gero ahalik
> eta itzultzaile gehien lortzea, itzultzaile bakoitzak gutxiago itzultzeko.
>
> Iñigok bidali didan materiala jarraibideak eta hiru .csv fitxategi dira,
> Calc-ekin ireki beharrekoak. Hiru zutabe dituzte: ingelesezko jatorrizko
> esaldien zutabea, Google-ren euskarazko itzulpenen zutabea eta euskarazko
> esaldi zuzena idazteko zutabea. Hiru .csv fitxategiekin proiektu ireki bat
> sortzerik bagenu itzulpengintzarako crowdsourcing plataforma batean...
>
> Zer iruditzen zaizue? Egin daiteke?
>
> Zure zalantzari dagokionez, oraintxe idatziko diot Iñigori, agian ez baitu
> aztertu aukera hori. Helaraziko dizuet bere erantzuna erantzuten didanean.
>
> Lierni
>
> *Lierni Garmendia*
>
> *EU/ES, EN, DE, CA > ES/EU Itzultzailea*
>
> *Zuzentzailea*
>
> *Hizkuntz irakaslea*
>
> 2017-08-02 14:35 GMT+02:00 Osoitz E <oelkoro a bildua gmail.com>:
>
>> Aupa Lierni,
>>
>> Niri ideia orokorrean oso interesgarria iruditzen zait, denok amestu dugu
>> itzulpenak egiterako orduan lan astunena kenduko digun tresnaren bat.
>>
>> Aipatzen duzun itzulpen proiektu horrentzat, proiektua software librea
>> bada, Crowdin, Transifex edo hosted.weblate bezalako zerbitzari batean
>> jartzea dago, beste aukera bat weblate softwarea norberaren zerbitzari
>> batean instalatzea da. Librezalek badu Pootle instalazio bat, baina
>> zaharkituta dago, ez dugu erabiltzen, eta ez eguneratzea erabaki zen Pootle
>> bertsio berriak mantentzeko oso konplexuak omen direlako, aurreko astean
>> pribatuan apur bat hitz egin genuen gutariko batzuk Weblate softwarea
>> Librezaleren zerbitzarian instalatzeari buruz, baina oraindik ez dugu
>> egiaztatu posiblea den ezta zerrendan eztabaidatu.
>>
>> Zalantza bat ere badut, Googlek egindako itzulpen automatikoak eskuz
>> egindako itzulpenekin konparatzea bada helburua, zergatik ez egin
>> alderantziz? Itzulpen okerrak zuzendu ordez, jada orokorrean ontzat ematen
>> den itzulpen bat hartu, demagun GNOME eta kate horiek guztiak Googlei
>> itzultzea eskatu.
>>
>> Osoitz
>>
>>
>> Lierni GARMENDIA ARRATIBEL<lierni.garmendia a bildua jakintza.net> igorleak hau
>> idatzi zuen (2017(e)ko abuztua 2 09:32):
>>
>> Egun on guztioi!
>>>
>>> Lehenik eta behin, partekatu nahi nuen asko poztu ninduela LibreOffice
>>> 5.4 argitaratu zutela eta euskaraz ere bazetorrela irakurtzeak. Zorionak,
>>> Librezale!
>>>
>>> Abuztuko proiektuari dagokionez, ea zer iruditzen zaizuen nire
>>> proposamena. Ezberdina da, baina euskal komunitatearentzat eta
>>> Librezalerentzat oso interesgarria eta etorkizunean oso erabilgarria izan
>>> daitekeela iruditzen zait.
>>>
>>> Iñigo Jauregi Sydneyko Unibertsitatean doktoretza-ikerketa bat egiten
>>> ari den gazte euskalduna da. Telekomunikazio-ingeniaria da bera, baina
>>> ingelesa-euskara itzulpen automatiko neuronala (Neural Machine Translation,
>>> NMT) ari da ikertzen orain, eta horregatik jarri da harremanetan nirekin:
>>> lehendik dagoen ingelesa-euskara corpusa txikiegia da eta zabaldu egin nahi
>>> du itzultzaile automatikoa entrenatzen hasteko, eta, horretarako, corpus
>>> bat prestatu du eta ingelesetik euskarara itzuli nahi du. Zer iruditzen
>>> zaizue? Laguntzeko prest zaudete? Abuztuko proiektua ez bada, laguntzeko
>>> prest dago inor?
>>>
>>> Nik hau pentsatu dut: Itzulpen proiektu bat sortu itzulpengintzarako
>>> crowdsourcing plataforma batean, zeinak itzulpen memoria (TM) komun bat eta
>>> glosategi komun bat sortzea eta elikatzea ahalbidetzen duen. Horrela,
>>> errazagoa, azkarragoa eta koherenteagoa izango da itzulpena, eta egokiagoa
>>> corpusa, bere ikerketarako. Gero, ahalik eta itzultzaile gehien lortu
>>> beharko genituzke, itzultzaile bakoitzak gutxiago itzultzeko.
>>>
>>> Atxikita bidaltzen dizuet pasatu didan dokumentua. Bertan aurkituko
>>> dituzue proiektuaren inguruko xehetasunak.
>>>
>>> Zuen erantzunaren zain geratzen naiz,
>>>
>>> Lierni
>>>
>>> *Lierni Garmendia*
>>>
>>> *EU/ES, EN, DE, CA > ES/EU Itzultzailea*
>>>
>>> *Zuzentzailea*
>>>
>>> *Hizkuntz irakaslea*
>>>
>>> 2017-08-01 18:58 GMT+02:00 Asier Sarasua Garmendia <
>>> asier.sarasua a bildua gmail.com>:
>>>
>>>> ar., 2017.eko aburen 01a 13:39(e)an, Osoitz E igorleak idatzi zuen:
>>>> > Aupa,
>>>> >
>>>> > Hilabeteko proiektua bizirik mantendu da, beraz, jarrai dezagun...
>>>> >
>>>> > Ni Riot itzultzen hasi naiz, hori jarri dezakegu proiektu gisa edo
>>>> > ohiko eztabaida eta bozketa egin.
>>>> >
>>>> > Zer diozue?
>>>>
>>>> Nik ez dut askorik egingo abuztuan, LibreOffice laguntzaren itzulpena
>>>> bukatzea ez bada; beraz nire partetik, zuk nahi duzuna.
>>>>
>>>> Nik beste proiektu bat dut begiz jota: LMMS[1]. Hurrengo baterako.
>>>>
>>>> Asier.
>>>>
>>>> [1]https://lmms.io/
>>>>
>>>> _______________________________________________
>>>> Librezale mailing list
>>>> Librezale a bildua librezale.eus
>>>> https://librezale.eus/cgi-bin/mailman/listinfo/librezale
>>>>
>>>
>>>
>>> _______________________________________________
>>> Librezale mailing list
>>> Librezale a bildua librezale.eus
>>> https://librezale.eus/cgi-bin/mailman/listinfo/librezale
>>>
>>>
>>
>> _______________________________________________
>> Librezale mailing list
>> Librezale a bildua librezale.eus
>> https://librezale.eus/cgi-bin/mailman/listinfo/librezale
>>
>>
>
-------------- hurrengo zatia --------------
Erantsitako HTML dokumentu bat ezabatu egin da...
URL: <http://librezale.eus/pipermail/librezale/attachments/20170803/fe732977/attachment-0001.html>


More information about the Librezale mailing list