Česká geologická služba
Česká geologická služba


Projekt  "Digitální mapový archiv České geologické služby"

V závěru roku 2000 byly úspěšně zahájeny práce na projektu "Digitální mapový archiv České geologické služby". Zadavatelem projektu je Odbor geologie, Ministerstva životního prostředí a hlavním řešitelem Česká geologická služba. Celková doba trvání projektu, který je financován z prostředků geologických prací odboru geologie MŽP, byla stanovena na období 2000 - 2004.

Hlavní cíle projektu
Hlavním záměrem tohoto projektu je kompletní převedení mapového fondu odborného archivu ČGS (cca 47 tis. map + cca 15 tis. map ČGS-Geofondu) včetně přílohové dokumentace (geologická legenda, vysvětlivky, strukturní řezy, stratigrafické kolonky aj., přes 200 tis. dokumentů), do digitální formy. Digitalizace často unikátní archivní mapové dokumentace zabezpečí uchovaní v "trvanlivém" formátu a zároveň umožní zefektivnění přístupu k primární dokumentaci formou Intranet/Internet aplikací či speciálních tématických CD/DVD ROMů.

Realizace hlavního záměru představuje čtyři hlavní okruhy prací, které se dále člení na řešení dílčích úkolů (aplikací). Většina těchto úkolů byla plánována, některé však vznikly v souladu s postupem prací na projektu. Hlavní okruhy prací jsou:

  1. Přípravné práce:
    1. Detailní analýza celého mapového fondu.
    2. Zřízení nového digitalizačního pracoviště včetně jeho vybavení HW, SW.
    3. Vytvoření logického modelu evidenční databáze.
    4. Tvorba aplikací pro kompletní evidenci, sledování a archivaci vznikajících digitálních dokumentů.
    5. Hledání optimálních parametrů skenování (barevná hloubka, rozlišení, datový formát, komprimace aj.)
  2. Digitalizace analogových map a příloh uložených v archivu ČGS a částečně ČGS-Geofondu:
    1. Tvorba pracovních postupů a jejich dokumentace.
    2. Školení pracovníků.
    3. Kontrola kvality dat.
    4. Modifikace aplikací.
    5. Archivace dat.
  3. Integrace dat vznikajících digitalizací do jednotného informačního systému ČGS (Centrálního datového skladu Praha - Klárov), případně jednotného geologického informačního systému (GEOSIS) MŽP ČR:
    1. Tvorba aplikace na konverzi dat do RDBMS Oracle (Centrální datový sklad).
    2. Kontrolní aplikace na konzistenci dat.
  4. Tvorba uživatelských www databázových aplikací pro zajištění on-line přístupu k digitálním datovým zdrojům archivu (Intranet, Internet, CD/DVD) pro odbornou i laickou veřejnost:
    1. Tvorba www aplikací tzv. mapové prozkoumanosti.
    2. Tvorba tématických CD/DVD.
    3. Tvorba uživatelské aplikace do digitální studovny archivu ČGS.


Metodika zpracování
Přípravné práce
Na základě detailní analýzy celého mapového fondu, jenž byla provedena v úvodu projektu (zač. 2001) došlo k upřesnění počtů jednotlivých map a mapových dokumentů včetně jejich kvality, počtu jednotlivých signatur a jejich umístění (Praha - Klárov, Lužná u Rakovníka, Praha - Kostelní). Dále byly popsány problematické dokumenty z pohledu skenování. Z této analýzy vyvstaly nepřímo i další možnosti rozvoje digitálního mapového fondu. Vzhledem k tomu, že proces digitalizace celého mapového fondu představuje z hlediska archivu i totální revizi fondu, nabízela se možnost doplnění zpracování o aplikaci technologie čárového kódu. Tato technologie je využita jednak v nové struktuře správy mapového datového fondu, jednak k jednoznačné registraci map a v další etapě k využití v oblasti výpůjčního protokolu.
Z bývalých prostor garáže a částečně archivu ČGS bylo v první polovině roku 2001 v rámci stavební rekonstrukce zřízeno a HW/SW vybaveno moderní digitalizační pracoviště. Pracoviště se podle prováděných prací dělí na tři úseky:

  1. Úsek editace a přípravy dokumentu pro digitalizaci.
    Zde dochází ke komplexní revizi a doplnění bibliografického záznamu o dokumentu v rámci aplikace pro správu datového skladu. Dále na tomto úseku dochází k nalepení a načtení čárových kódů a revize mapového fondu. V případě duplicit jsou vybírány pro skenování jen ty nejvhodnější mapové podklady, duplicity jsou pouze registrovány v databázi. Úsek je tvořen třemi pracovními stanicemi (PC).
  2. Úsek digitalizace.
    Tento úsek je členěn na tři dílčí pracoviště vybavené profesionálními skenery. Mapy a mapové přílohy formátů větších než A3 jsou digitalizovány na velkoformátovém barevném skeneru CONTEX CHROMA 8040, mapové přílohy do formátu A3 jsou digitalizovány na barevném skeneru UMAX PowerLook 2100XL, vysvětlivky jsou digitalizovány pomocí skeneru UMAX Astra 4500.
  3. Úsek archivace dat.
    Veškerá data jsou zálohována na 40GB DLT páskách (při použití komprese až 80GB) pomocí dvou zálohovacích zařízení HP SureStore DLT1.

Podstatnou částí přípravných prací (2000 - 2001) před spuštěním provozu digitalizace mapového fondu, bylo vytvoření struktury databáze digitálního mapového archivu. Aplikace, které byly nad touto databází vytvořeny, umožňují registraci a přípravu mapového fondu, ale i sledování oběhu dokumentu v rámci digitálního zpracování. Logická struktura databáze částečně vycházela z existující evidenční archivní mapové databáze.

Současná struktura databáze digitálního mapového archívu ČGS:



Aplikace systému integrovaného digitálního mapového archívu ČGS:
Aplikace pro sledování oběhu dokumentů se skládá z pěti částí. V rámci přípravných prací prováděných v roce 2001 byl hlavní důraz kladen na tvorbu prvních čtyř komponent:

  • aplikace pro pořizování dat
  • aplikace pro kontrolu formátování a archivaci dat
  • aplikace pro správu datového skladu
  • aplikace pro sledování oběhu dokumentů
V průběhu roku 2002 došlo k částečným modifikacím jednotlivých aplikací a celkový systém byl doplněn o část:
  • aplikace pro distribuci dat

Všechny komponenty pracují nad jednotnou evidenční databází a jsou součástí systému pro začleňování výsledků skenování do subsystému IS ČGS:


Proces digitalizace
Jelikož objem dokumentů určených k digitalizaci je obrovský (cca. 200 tis.) bylo nezbytné vypracovat detailní pracovní postupy, včetně zavedení mechanizmů kontroly kvality a jakosti. V průběhu roku 2001 v rámci tzv. poloprovozního režimu digitalizace, byly "laděny" technické parametry digitalizace. Od počátku projektu bylo zřejmé, že každý digitální dokument bude archivován ve třech kvalitativních verzích. Kvalita těchto verzí koresponduje se způsobem využití, tzn. zálohová kopie dat - nejvyšší, použití v digitální studovně archivu ČGS (Intranetu ČGS) - střední kvalita a laické veřejné prohlížení na Internetu - nejnižší.
Provozní skenování dle zjednodušeného pracovního postupu (viz. obrázek níže) bylo zahájeno od počátku roku 2002.


Předávání a kontrola pohybu digitalizovaných dokumentů mezi úsekem (pracovištěm) editace a digitalizace probíhají pomocí předávacích protokolů v obou směrech prostřednictvím aplikace "Předávání". Tištěné formuláře předávání jsou průběžně ukládány, archivovány a kontrolované předávajícími osobami.
Archivace dat je řešena formou zálohování na 40/80 GB DLT pásky. Informace o způsobu archivace včetně identifikátoru pásky jsou doplňovány do centrální databáze pomocí aplikace "Almanach", což je aplikace pro začleňování výsledků archivace do databáze mapového archívu ČGS. Jak je patrné z obrázku výše zálohují se nejenom 3 hlavní kvalitativní verze digitálních dokumentů, ale i tzv. meziprodukty. Vyjma datově objemných, tzv. zálohovacích verzí, jsou ostatní verze ukládány (integrovány) do centrálního datového serveru (skladu) ČGS. Tím je mimo jiné zabezpečena ON-LINE dostupnost těchto dat a zároveň jsou vytvořeny další bezpečnostní kopie dat.
Zaregistrováním souboru na archivním mediu a fyzickým návratem papírového dokumentu je splněna podmínka úplného záznamu o dokumentu v evidenční databázi.
Dokument je možné od tohoto okamžiku integrovat do IS ČGS. Toto se děje pomocí aplikace přesunující data o dokumentu z registrační databáze do centrálního skladu.


Integrace dat do IS ČGS a tvorba uživatelských www aplikací
V souladu s ročním plánem prací byly zahájeny práce na integraci dat vznikajících provozním skenováním dokumentů archivu do IS ČGS. Součástí tohoto úkolu je tvorba Internetových aplikací pro přístup k centrální mapové databázi ČGS a tím i k distribuci dat. V současné době jsou vytvořeny a na www informačním portále ČGS www.geology.cz zpřístupněny první verze těchto aplikací:

  • Mapová prozkoumanost - formou listokladů
  • Mapová prozkoumanost - formou geografického (prostorového) dotazu
  • Mapová prozkoumanost - forma "negrafického" dotazu do RDBMS
  • První verze Internet mapového serveru ČGS - forma GIS

Technické řešení tohoto dílčího úkolu úzce souvisí s dalšími projekty útvaru Informatiky ČGS. Obzvláště pak budování www mapového serveru bude navazovat na technologické postupy a řešení těchto interních projektů ČGS:

  • Vytvoření jádra mapového serveru ČGS - č.úkolu ČGS 3404
  • Rozvoj informačního www portálu ČGS - č. úkolu ČGS 3403
  • Datové zdroje ČGS - rozvoj, správa a využití - č. úkolu ČGS 3405
  • Rozvoj metodiky, tvorby a publikace GIS dat v ČGS - č. úkolu ČGS 3406


CD/DVD-ROM Geologické mapy ČR 1 : 25 000 je prvním příkladem tématické HTML aplikace, která využívá výsledků (dat) tohoto projektu. Jedná se o soubor všech geologických map (tištěných i autorských originálů) v měřítku 1 : 25 000 v souřadných systémech S-JTSK a S42 z produkce ČGS obsažených v digitálním archívu ČGS a to včetně grafických příloh a vysvětlivek.

WWW aplikace, ON-LINE přístup, tématické CD/DVD ROMy, digitální studovna aj. to vše jsou aplikace, které podporují myšlenku, kde uživatel popř. návštěvník archivu ČGS nepřichází s originálem mapové dokumentace téměř vůbec do styku. Jenom tak bude splněn hlavní záměr tohoto projektu - trvalé a bezpečné uchování archivní mapové dokumentace a současně zajištění přístupu odborné i laické veřejnosti k informacím uloženým v odborném archivu České geologické služby.


Zpracoval Mgr. Robert Tomas
Vedoucí projektu