Konverze kódování češtiny

Mezi užitečné konverzní utility patří také cstocs ze stejnojmenného balíčku. Tento program umožňuje převést soubor s určitým kódováním češtiny do jiného kódování. Program umí zacházet s těmito druhy kódování:
* ascii
- text bez akcentů
* il1
- kódování ISO-8859-1 (západní Evropa)
* il2
- kódování ISO-8859-2 (východní Evropa, slovanské jazyky)
* kam
- kódování bří. Kamenických, v éře DOSu jedno z nejpoužívanějších kódování češtiny
* koi
- staré KOI-8 kódování
* pc2
- kódování PC-Latin 2, podporované MS-DOSem
* 1250
- kód, který používají české Windows
* tex
- kódování diakritiky v TeX sekvencích
* utf8
- nové kódování Unicode (8-bitové)
K dispozici jsou i další druhy kódování (cork, VGA, 1252, Mac) - jejich popis viz. man cstocs.

Příklady konverze určitých typů souborů do kódování il2, které podporuje editor Emacs (viz. odstavec 4.9):

Téměř univerzální je utilita recode ze stejnojmenného balíčku, umožňující konverzi mezi širokou škálou různých kódování, včetně Unicode (UTF-8). Lze ji s výhodou použít jako filtr při čtení pošty -- viz. odstavec 8.3. Podrobnosti o programu viz. info recode.


Tomáš Davídek, poslední změna 2007-05-29