Off topic: OT: Pomoc s Mozilla Common Voice
Téma indítója: Vojtěch Drábek

Vojtěch Drábek
Csehország
angol - cseh
Apr 7, 2020

Dobrý den,

Mozilla Common Voice je projekt pro vytvoření svobodného korpusu mluvené řeči, primárně pro tvorbu systémů automatického rozpoznávání řeči. Kvůli nedostatku vět, které by přispěvatelé četli a které by zároveň nebylo možné vykládat jako autorsky chráněné, byla vytvořena aplikace pro automatickou extrakci vět z Wikipedie.

Návrh na podporu češtiny je tam už od února, ale zatím jsem nesehnal nikoho, kdo by prošel nějakou
... See more
Dobrý den,

Mozilla Common Voice je projekt pro vytvoření svobodného korpusu mluvené řeči, primárně pro tvorbu systémů automatického rozpoznávání řeči. Kvůli nedostatku vět, které by přispěvatelé četli a které by zároveň nebylo možné vykládat jako autorsky chráněné, byla vytvořena aplikace pro automatickou extrakci vět z Wikipedie.

Návrh na podporu češtiny je tam už od února, ale zatím jsem nesehnal nikoho, kdo by prošel nějakou část vzorku vygenerovaných vět a odhadl počet chyb, zejména pravopisu, ale i gramatiky a nevyslovitelných nebo neobvyklých cizích jmen a slov.

Připadá mi škoda do tohoto nástroje češtinu nepřidat, už proto, že se už některé věty pro přispěvatele začínají opakovat a přidávat ručně nové je problematické. Překladatelé a lokalizátoři jsou pro toto ideální, pokud někdo máte pár minut nebo desítek minut a nemáte co dělat:-), můžete prosím projít aspoň sto vět z https://gist.github.com/comodoro/a2606297fb77c2fa7dcc399ed6559c70 a dát vědět buď tady, zprávou nebo (pokud používáte Github) na https://github.com/Common-Voice/cv-sentence-extractor/pull/90?

Díky moc
Vojtěch Drábek
Collapse


 

Milan Condak  Identity Verified
Local time: 06:59
angol - cseh
Bezplatné versus placené aplikace Apr 9, 2020

Vojtěch Drábek wrote:

Návrh na podporu češtiny je tam už od února, ale zatím jsem nesehnal nikoho, kdo...

Díky moc
Vojtěch Drábek


Ahoj Vojtěchu,

na tomto fóru jsem nikdy nechtěl, aby někdo pracoval zadarmo. Leda pro své potěšení, a aby jiným udělal radost. Požádal jsem překladatele, aby doplňovali data do slovníku Apertium. Funguje samostatně nebo v OmegaT a to oboustranně. Moje přání jsem vyslovil v roce 2013.
Potom jsem vyzval překladatele, ať lokalizují (přeloží z angličtiny do češtiny textové řetězce) Wordfastu Anywhere, za což mohou 3 překladatelé získat licenci Wordfastu Studio (WFC+WFP). Přihlásil se mi jeden překladatel, který přeložil objem práce, za který mohl získat licenci "zdarma", a který již licenci měl. Práce na dva překladatele doposud čeká. Přitom je možno využít integrovanou funkci diktovat překlad česky. Naučit se přitom jak týmově lokalizovat software.

Proti těmto komunitním aktivitám jsou k dispozici aplikace pro využití služeb rozpoznávání řeči digitálních a komunikačních gigantů, kteří mají každodenně aktualizovaná textová i řečová data (Skype, WhatUp, Hangup, aj.)

Platí se zde POUZE ztrátou soukromí.

https://lightpdf.com/cz/aplikace-na-rozpoznavani-hlasu.html

Milí kolegové,

kdo chcete Vojtěchovi (a v budoucnosti svému soukromí) pomoci zapojte se.

Pokud jde o moje staré výzvy: na Apertium jsem rezignoval a kdo má zájem získat licenci Wordfastu Studio, může si informace snadno získat nebo mě privátně kontaktovat.


 

Vojtěch Drábek
Csehország
angol - cseh
TÉMAINDÍTÓ
OT: Pomoc s Mozilla Common Voice Apr 9, 2020

Asi bych měl upřesnit, že nejsem nijak spojen s organizací Mozilla, kromě toho, že občas používám jejich produkty. O Common Voice mám zájem jen z toho důvodu, že jsem zkoušel nějaké modely rozpoznávání řeči a při tom zjistil, že českých řečových dat je zoufale málo. Ani bych to neoznačil za práci - přečtení řekněme sta vět například od 200 do 299 a napsání, kolik jich je podle mého názoru chybných.

 

Milan Condak  Identity Verified
Local time: 06:59
angol - cseh
CEF Digital pasáž Apr 9, 2020

Doplněk: část textu z CEF o rozpoznávání řeči. Vždy anglická věta a její strojový překlad do češtiny.

The EC intends to allocate EUR 2.5 million to these objectives in the next two years (2020-21), including the continuation of the ELRC programme and the work of the Language Resources Board (LRB).

ES má v úmyslu přidělit na tyto cíle v příštích dvou letech (2020–21) 2.5 milionů EUR, včetně pokračování programu ELRC a činnosti Rady jazyk
... See more
Doplněk: část textu z CEF o rozpoznávání řeči. Vždy anglická věta a její strojový překlad do češtiny.

The EC intends to allocate EUR 2.5 million to these objectives in the next two years (2020-21), including the continuation of the ELRC programme and the work of the Language Resources Board (LRB).

ES má v úmyslu přidělit na tyto cíle v příštích dvou letech (2020–21) 2.5 milionů EUR, včetně pokračování programu ELRC a činnosti Rady jazykových zdrojů.

Poslední úpravy překladu LF Aligner 4.21 dne 5.4.2020 v 21:27:52
It is worth noting the new objectives that have appeared among the proposed tasks, such as the creation of tools for automatic speech recognition or the automatic text summarization.

Za zmínku stojí nové cíle, které se objevily v souvislosti s navrhovanými úkoly, jako je například vytvoření nástrojů pro automatické rozpoznávání řeči nebo automatické shrnutí textu.

In addition to the mentioned EUR 2.5 million in this year’s CEF Telecom call, EUR 4 million have been earmarked for projects involving the collection of language resources, language tools and integration projects, so that the total funding for reducing the language barriers to the Digital Single Market, promotion of European multilingualism and protecting endangered languages at risk of digital extinction has increased considerably.

Kromě uvedených 2.5 milionů EUR v letošní výzvě Nástroje pro propojení Evropy v oblasti telekomunikací bylo vyčleněno 4 milionů EUR na projekty týkající se shromažďování jazykových zdrojů, jazykových nástrojů a integračních projektů tak, aby se výrazně zvýšil celkový objem finančních prostředků na snižování jazykových překážek na jednotném digitálním trhu, podporu evropské mnohojazyčnosti a ochranu ohrožených jazyků při riziku vyhynutí.

Milan
PS: eTranslate (k dispozi od 1.4.2020) je výsledkem takového financování v období 2016-2020.
Collapse


 


Ehhez a fórumhoz nincs külön moderátor kijelölve.
Ha a webhely szabályainak megsértését kívánja jelenteni, vagy segítségre van szüksége, lépjen kapcsolatba a webhely munkatársaival ».


OT: Pomoc s Mozilla Common Voice

Advanced search






Anycount & Translation Office 3000
Translation Office 3000

Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.

More info »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »



Forums
  • All of ProZ.com
  • Terminológiai keresés
  • Munkák
  • Fórumok
  • Multiple search