Databáze MOS – otevřená data - dokumentace
Databáze MOS – otevřená data
Databáze MOS obsahuje statistická data za městskou a obecní statistiku. Údaje jsou seskupeny do samostatných ročních souborů a prezentují data za obce od roku 2000 do současnosti. Data se vztahují vždy k aktuálnímu území obce platnému v příslušném roce. Datový soubor za každý rok je po prvním zveřejnění následně ještě jednou aktualizován.
V souborech jsou zastoupeny různé obory statistiky představující tyto okruhy:
- Obecná charakteristika
- Školství
- Zdravotnictví
- Obyvatelstvo
- Byty
- Lázně
- Druhy pozemků
- Sociální oblast
- Ekonomické subjekty
- Cestovní ruch
- Hospodaření obcí
- Sčítání lidu, domů a bytů 1991, 2001, 2011, 2021
- Nezaměstnanost
- Technické a občanské vybavení obcí 2016
Celkový počet ukazatelů v těchto statistických okruzích je 792.
Číselník ukazatelů obsahuje kromě kódu a názvu ukazatele také další informace, včetně zdroje dat a metodického vymezení jednotlivých ukazatelů. Vyskytují se v něm následující zdroje dat:
- ČSÚ – Český statistický úřad
- ČÚZK – Český úřad zeměměřický a katastrální
- GŘ Úřadu práce ČR – Generální ředitelství Úřadu práce ČR
- MFIN ČR – Ministerstvo financí ČR
- MPSV ČR – Ministerstvo práce a sociálních věcí ČR
- MŠMT ČR – Ministerstvo školství, mládeže a tělovýchovy ČR֪
- MV ČR – Ministerstvo vnitra ČR
- ÚZIS – Ústav zdravotnických informací a statistiky ČR
Číselník území této obsahuje historii územních změn. Kromě kódu a názvu obce je uvedena také příslušnost obce k vyššímu správnímu území (SO ORP, okres) v příslušném roce.
Seznam a struktura souborů
1. MOS_DATA_rrrr – datový soubor, kde rrrr je údaj roku
- ROK - údaj roku
- KODUKAZ - šestimístný kód ukazatele
- KODUZEMI - šestimístný kód území
- HODNOTA - číselný údaj nebo "i.d." pro chráněný údaj
2. MOS_UKAZ – číselník ukazatelů
- KODUKAZ - šestimístný kód ukazatele
- NAZEV - název ukazatele
- MJ - měřicí jednotka
- PLATIOD - platí od roku
- PLATIDO - platí do roku
- OKRUH - dvoumístný kód okruhu
- ZDROJ - primární zdroj dat (s eventuálním upřesněním)
- VERIFIKACE_CSU - pokud je uvedeno "ano", ČSÚ data z primárního zdroje zpřesňoval
- METODIKA - metodické vymezení ukazatele
3. MOS_UZEMI – číselník území
- KODUZEMI - šestimístní kód obce
- OBEC - název obce
- PLATIOD - platí od roku
- PLATIDO - platí do roku
- OKRES - název okresu, do kterého obec patří v uvedeném časovém intervalu
- SOORP - název SO ORP, do kterého obec patří v uvedeném časovém intervalu
4. MOS_OKRUHY – seznam statistických okruhů dat
- KOD - dvoumístný kód okruhu
- NAZEV - název okruhu
Soubory jsou ve formátu CSV a splňují standardy otevřených dat, konkrétně tyto požadavky:
- Soubor CSV má kódování UTF-8 (ve variantě bez BOM)
- Jednotlivé řádky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
- Údaje v řádku jsou zapsány jako řetězce oddělené čárkou (znak , s UTF-8 kódem U+002C)
- Uvozovka v textech je zdvojená, tj. místo " je zapsána jako ""