Databáze KROK – otevřená data - dokumentace
Databáze KROK – otevřená data
Databáze KROK obsahuje agregovaná statistická data za Českou republiku, regiony soudržnosti, kraje, okresy a správní obvody obcí s rozšířenou působností. Údaje jsou seskupeny do samostatných ročních souborů a prezentují data za uvedené územní celky od roku 2000 do současnosti. Data se vztahují vždy k aktuální územní struktuře platné v příslušném roce. Datový soubor za každý rok je po prvním zveřejnění následně ještě jednou aktualizován.
V souborech jsou zastoupeny různé obory statistiky představující tyto okruhy:
- Území, katastrální výměry
- Osídlení
- Obyvatelstvo
- Ekonomické subjekty
- Nezaměstnanost (kraje, okresy)
- Pracovní síla a ekonomicky neaktivní obyvatelstvo (VŠPS)
- Průmysl
- Zemědělství
- Stavebnictví
- Bytová výstavba
- Doprava a dopravní síť
- Zdravotnictví, pracovní neschopnost
- Důchodové zabezpečení
- Kriminalita, dopravní nehody, požáry
- Hospodaření krajů
- Školství
- Sociální služby
- Sčítání lidu, domů a bytů 2001, 2011, 2021
- Nezaměstnanost (SO ORP)
Celkový počet ukazatelů v těchto statistických okruzích je 1 252.
Číselník ukazatelů obsahuje kromě kódu a názvu ukazatele také další informace, včetně zdroje dat a metodického vymezení jednotlivých ukazatelů. Vyskytují se v něm následující zdroje dat:
- ČSÚ – Český statistický úřad
- ČSSZ – Česká správa sociálního zabezpečení
- ČÚZK – Český úřad zeměměřický a katastrální
- GŘ Úřadu práce ČR – Generální ředitelství Úřadu práce ČR
- HZS ČR – Hasičský záchranný sbor ČR
- MD ČR – Ministerstvo dopravy ČR
- MFIN ČR – Ministerstvo financí ČR
- MPSV ČR – Ministerstvo práce a sociálních věcí ČR
- MŠMT ČR – Ministerstvo školství, mládeže a tělovýchovy ČR֪
- Policejní prezidium ČR – Policejní prezidium ČR
- ŘSD ČR – Ředitelství silnic a dálnic ČR
- ÚZIS – Ústav zdravotnických informací a statistiky ČR
Číselník území má pevnou strukturu kódů území, tzn., že územní struktura je považovaná za neměnnou za celé období od roku 2000 po současnost. Územní změny v krajích, okresech a SO ORP, pokud k nim došlo, jsou promítnuté v datech příslušného roku a v letech následujících. Zpětné přepočty dat nejsou prováděny.
Seznam a struktura souborů
1. KROK_DATA_rrrr – datový soubor, kde rrrr je údaj roku
- ROK - údaj roku
- KODUKAZ - šestimístný kód ukazatele
- KODUZEMI - čtyřmístný kód území
- HODNOTA - číselný údaj nebo "i.d." pro chráněný údaj
2. KROK_UKAZ – číselník ukazatelů
- KODUKAZ - šestimístný kód ukazatele
- NAZEV - název ukazatele
- MJ - měřicí jednotka
- PLATIOD - platí od roku
- PLATIDO - platí do roku
- OKRUH - dvoumístný kód okruhu
- ZDROJ - primární zdroj dat (s eventuálním upřesněním)
- VERIFIKACE_CSU - pokud je uvedeno "ano", ČSÚ data z primárního zdroje zpřesňoval
- METODIKA - metodické vymezení ukazatele
3. KROK_UZEMI – číselník území
- KODUZEMI - čtyřmístný kód území
- UZEMI - název území
- TYPUZEMI - pojmenování typu území textově
4. KROK_OKRUHY – seznam statistických okruhů dat
- KOD - dvoumístný kód okruhu
- NAZEV - název okruhu
Soubory jsou ve formátu CSV a splňují standardy otevřených dat, konkrétně tyto požadavky:
- Soubor CSV má kódování UTF-8 (ve variantě bez BOM)
- Jednotlivé řádky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
- Údaje v řádku jsou zapsány jako řetězce oddělené čárkou (znak , s UTF-8 kódem U+002C)
- Uvozovka v textech je zdvojená, tj. místo " je zapsána jako ""