Index

Obsah

Kapitola 1

Kapitola 2

Kapitola 3

Kapitola 4

Kapitola 5

Kapitola 6

Kapitola 7

Kapitola 3

Typy zdrojových souborů


V této kapitole se naučíte základní věci. Jak určit o který typ souboru se jedná a podle toho potom zjistit, který ze způsobu překladu použít.

V této chvíli už budeme předpokládat, že víte, v jakém souboru (souborech) jsou texty uloženy. Je tedy třeba určit způsob následného zpracování textů.

Vše záleží na tom, jakým způsobem jsou texty ve hře uloženy. Nejprve je nutné zjistit, v jakém formátu jsou zdrojové soubory. Jak to udělat? Stačí se na ten či onen soubor podívat jakýmkoliv prohlížečem. Já osobně to dělám v DOS Navigátoru. A to proto, že v textovém režimu se mi zobrazí všechny znaky ASCII tabulky tak, jak jsou uloženy v souboru. Pokud se na tento souborpodívám např. ve Windows Commanderu, vše vypadá jinak. Ale samozřejmě vše záleží na vás.


3.1 Čistě textové soubory

Čistě textový soubor je takový soubor, který neobsahuje žádné netisknutelné znaky. Prostě jsou tam jenom normální čísla, písmena a klidně i jiné speciální znaky (@, #, %, ...) . Hlavně je třeba si všimnout, zda jednotlivé řetězce nejsou uloženy v tzv. formátu jazyka C/C++, kdy je řetězec ukončen znakem s hodnotou 0 (nula). V tomto případě se už nejedná o čistě textový soubor, ale o soubor binární.

Někdy se taky stává, že pouhému oku se soubor jeví jako textový, ale přitom nepoužívá např. standartní znaky pro přechod na nový řádek a používá jen jeden znak. Takže pokud se na takovýto soubor podíváte např. v Notepadu, bude vše v pořádku, ale jakmile se podíváte na strukturu v hexeditoru, zjistíte, že to tak není. Pak může docházet při překladu k chybám, kterou způsobuje třeba ten jeden znak navíc.

Nejjednodušší způsob, jak zjistot, zda se jedná o textový soubor je otevřít ho např v Notepadu a uložit ho pod jiným jménem. Pokud bude délka a obsah stejný, jedná se o textová soubor. Pokud bude jiný, asi to tak nebude.

Ale myslím si, že normální textový soubor pozná asi každý.


3.2 Binární soubory

V tomto případě platí to, co jsem říkal už v úvodu. Že ne všechny pojmy asi správně sedí. Binární soubor je v podstatě každý soubor. Tady spíše hovoříme o způsobu, s jakým budeme k souboru přistupovat. Jestli budeme brát soubor jako čistě textový nebo binární. Tyto pojmy jsou hlavně pro programátory docela jasné a ostatní se s nimi nemusí zatěžovat.

Binární soubor v mém tutoriálu je každý soubor, který není čistě textový :-) Je to jednoduché. Pokud váš soubor nesplňuje podmínky pro soubor čistě textový, jedná se o soubor binární. Takže pokud jsou mezi jednotlivými větami (slovy) různé znaky, našli jste binární soubor.

Pokud je váš soubor ve tvaru, že obsahuje pravidelně 2B stylem: 1B=znak, 2B=0, jedná se o textový soubor, ale je ve formátu Windows, neboli v Unicode tvaru.

[ Ukázka ]


3.3 Zakódované soubory

Pokud víte, že váš soubor obsahuje texty, ale jeho obsah nedává smysl, je pravděpodobně nějakým způsobem zakódovaný. V tomto případě se stává překlad těžžším. Ale při troše štěstí se to dá zvládnout.


3.4 EXE a DLL soubory

U těchto typů souborů se snad nemusím nijak pozastavovat. Jenom snad i zde platí to, že mohou být kódované a komprimované.

 

Teď většinou nastává delší doba zkoušení způsobu komprese, popř. kódování a následné rozkódování souboru.