Tokenizéry
Thread poster: Milan Condak
Milan Condak
Milan Condak  Identity Verified
Local time: 21:43
English to Czech
Jul 2, 2014

Asi víte, co to je token. Je slovo v některém z možných tvarů. V tištěných slovnících bývají hesla a někdy obsahují i další možné tvary. V textu vidíme většinou tvary, které se od slovníkového hesla liší.

V příspěvku

Slovník Valodas k výuce slovíček

http://www.proz.com/forum/czech/254243.html

jsem uvedl odkaz
... See more
Asi víte, co to je token. Je slovo v některém z možných tvarů. V tištěných slovnících bývají hesla a někdy obsahují i další možné tvary. V textu vidíme většinou tvary, které se od slovníkového hesla liší.

V příspěvku

Slovník Valodas k výuce slovíček

http://www.proz.com/forum/czech/254243.html

jsem uvedl odkaz na moji prezentaci o slovníku Valodas, jedna odrážka uvádí

- jak využít data ze slovníků StarDict.

Dnes jsem funkci konverze slovníku StarDict do .CSV použil pro konverzi čínsko-anglického slovníku pro konverzi do .TXT. Chtěl jsem vyzkoušet funkci tokenizéru pro čínštinu v OmegaT. OmegaT nebyla schopna rozpoznat velký počet slov (skládají se z různého počtu znaků) a potom zobrazit jejich výskyt a překlad v okně slovníku.

StarDict Editor mi slovník do .TXT nepřevedl a tak jsem udělal konverzi pomocí programu Valodas. OmegaT jednotlivá slova v čínské textu rozpoznává a zobrazuje je a také jejich překlad v okně glosáře. Nyní si mohu v OmegaT listovat čínskými PDF soubory a se seznámit se s příručkami o programu Heartsome, které jsou pouze v angličtině a v čínštině.

Pro většinu našich překladatelů mají tokenizéry význam, když překládají texty ze zdrojového slovanského nebo ugrofinského jazyka a přitom používají glosář. Tokenizéry jsou součástí programu OmegaT.

Milan
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 21:43
English to Czech
TOPIC STARTER
Tokenizér při překladu z angličtiny Jul 9, 2014

Milan Condak wrote:

Pro většinu našich překladatelů mají tokenizéry význam, když překládají texty ze zdrojového slovanského nebo ugrofinského jazyka a přitom používají glosář. Tokenizéry jsou součástí programu OmegaT.

Milan


Udělal jsem prezentaci pro porovnání projektů, které povolují doplňovat na webech terminologii, použít staženou terminologii ve svých nástrojích a přidal jsem odkaz na TaaS, který má v budoucnosti pokrývat terminologii oficiálních jazyků států EU a ruštinu. Taas obsahuje hodně anglických a lotyšských termínů.

http://www.condak.cz/archiv-net/2014-07/07/cs/00.html

Pro demonstrování rozdílů jsem překladači "přeložil" deset vět z angličtiny do češtiny. V OmegaT jsem nepoužil slovník.
OmegaT nepoužívá ve slovnících tokenizér pro rozpoznávání terminologie. Používá jej pouze v glosářích. Slovníky mohou být rozsáhlé, glosáře by měly být úzce specializované. Zobrazené terminologie je příliš hodně.

Milan


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Tokenizéry






Anycount & Translation Office 3000
Translation Office 3000

Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.

More info »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »