OmegaT 3.5 - Guida del usator

Operar con le texto simple

Codification prefixate initial

Files de texto simple - in le major parte del casos le files con un extension txt - contine justo information textual e non offere alicun modo definite clarmente pro informar le computator re su proprie linguage. Le maxime que OmegaT pote facer in tal caso, es assumer que le texto es scribite in le mesme lingua que usa le computator ipse. Isto es nulle problema pro files codificate in Unicode con un collection de codification de character a 16 bit. Si le texto es codificate in 8 bits, tamen, on pote esser affrontate con le situation difficile sequente: in vice de monstrar le texto, pro le characteres japonese...

...le systema monstrara illo como isto per exemplo:

Le computator, functionante OmegaT, ha le russo como lingua base, e assi monstra le characteres in le alphabeto cyrillic e non in Kanji.

Le solution de OmegaT

Il ha in fundo tres manieras pro abbordar iste problema in OmegaT. Illos omne implica le application de filtros de file in le menu Optiones .

Cambia le codification de tu files a Unicode

aperi tu file fonte in un editor de texto que interpreta correctemente su codification e salva le file in codification "UTF-8" . Cambia le extension del file de .txt a .utf8. OmegaT automaticamente interpretara le file ut un file UTF-8. Isto es le alternativa plus sensate, pro sparniar te problemas in le longe opera.

Specifica le codification pro tu files de texto simple

- id es files con un extension .txt - : in le section Files de texto del fenestra de dialogo Filtros de File, cambia le Codification del File Fonte de <auto> le codification que corresponde a tu file fonte .txt, per exemplo in .jp por le exemplo precedente.

Cambia le extensiones de tu files fonte de texto simple

per exemplo ab .txt in .jp pro textos simple japonese: in le section Files de texto del fenestra de dialogo del Filtros de File, adde nove Modello Nomine de File Fonte (*.jp pro iste exemplo) e Selige le appropriate parametros pro le codification fonte e de destination

OmegaT ha per arrangiamento base le sequente curte lista disponibile pro facer plus facile pro te tractar alicun files de texto simple:

  • Le files .txt son automaticamente (<auto>) interpretate per OmegaT ut codificate in le codification base prefixate del computator.

  • Le files .txt1 son in ISO-8859-1, que coperi le major parte del linguas del Europa occidental .

  • Le files .txt2 son in ISO-8859-2, que concerne le major parte del linguas del Europa Central e Oriental

  • Le files .utf8 son interpretate per OmegaT como codificate in UTF-8 (un codification que concerne quasi tote le linguas in le mundo).

Tu pote controlar que tu mesme seligente le commando Filtros de File in le menu Optiones . Per exemplo, quando tu ha un file de texto checo (multo probabilemente scribite in le codice ISO-8859-2 ) tu debe sol cambiar le extension .txt in .txt2 e OmegaT interpretara su contentos correctemente. E naturalmente, si tu vole trovar te sur le latere secur, considera converter iste genere de file a Unicode, id es al formato de file .utf8 .