Konverze kódování češtiny
Mezi užitečné konverzní utility patří také cstocs ze
stejnojmenného balíčku. Tento program umožňuje převést soubor s určitým
kódováním češtiny do jiného kódování. Program umí zacházet s těmito druhy kódování:
-
ascii
- - text bez akcentů
-
il1
- - kódování ISO-8859-1 (západní Evropa)
-
il2
- - kódování ISO-8859-2 (východní Evropa, slovanské jazyky)
-
kam
- - kódování bří. Kamenických, v éře DOSu jedno z nejpoužívanějších
kódování češtiny
-
koi
- - staré KOI-8 kódování
-
pc2
- - kódování PC-Latin 2, podporované MS-DOSem
-
1250
- - kód, který používají české Windows
-
tex
- - kódování diakritiky v TeX sekvencích
-
utf8
- - nové kódování Unicode (8-bitové)
K dispozici jsou i další druhy kódování (cork, VGA, 1252, Mac) -
jejich popis viz. man cstocs.
Příklady konverze určitých typů souborů do kódování il2, které
podporuje editor Emacs (viz. odstavec 4.9):
Téměř univerzální je utilita recode ze stejnojmenného balíčku,
umožňující konverzi mezi širokou škálou různých kódování, včetně
Unicode (UTF-8). Lze ji s výhodou použít jako filtr při čtení pošty
-- viz. odstavec 8.3. Podrobnosti o programu
viz. info recode.
Tomáš Davídek, poslední změna 2007-05-29