OmegaT 3.5 - Guida del usator

Appendix D. Tokenizers

Introduction

Le cercatores del stirpe meliora le qualitate de concordantias con le recognition del parolas declinate in le datos del memoria fonte e in le traduction. Illos meliora alsi la concordantia del glossario.

Un cercator del stirpe pro le anglese deberea identificar, exempli gratia, le linea de character "cats" (e possibilemente "catlike", "catty" etc.) como basate sur le mesme radice "cat", e "stemmer", "stemming", "stemmed" como basate sur "stem". Un algorithmo de cerca del stirpe reduce le parolas "fishing", "fished", "fish", e "fisher" al radice, "fish". Isto es in modo special utile in caso de linguas que usa formas con prefixo e suffixo pro le parolas stirpe. Faciente se prestar un exemplo ex le sloveno, ci "bon" in omne possibile formas grammaticamente correcte:

  • lep, lepa, lepo - singular, masculin, feminin, neutral

  • lepši, lepša, lepše . - comparative, nominative, masculin, feminin, neutral, resp. Forma plural del adjective

  • najlepših - superlative, plural, genitive pro M, F, N

Selection del linguas

Le Tokenizers es includite in OmegaT e active per preparation initial. OmegaT selige automaticamente un tokenizer pro le lingua fonte e uno pro le lingua de destination secundo le configurationes del lingua del projecto. Il es possibile seliger un altere tokenizer (Tokenizer del lingua) o un version differente del tokenizer (Comportamento del Tokenizer) ex le fenestra Proprietates del Projecto.

In le caso que nulle tokenizer exists pro le lingua currente, OmegaT usa Hunspell in vice (in iste caso, face te secur que es installate le dictionarios Hunspell pertinente ).

Incompatibilitates

OmegaT non lanceara se si son trovate tokenizers in le plica /plugin. Leva tote le tokenizers ex le plica /plugin ante que tu lancea OmegaT.