špatná-praxe:nejednoznačné-identifikátory

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
špatná-praxe:nejednoznačné-identifikátory [2019/09/16 09:57]
Jakub Klímek vytvořeno
špatná-praxe:nejednoznačné-identifikátory [2020/06/03 09:37] (aktuální)
Řádek 1: Řádek 1:
 ====== Žádné nebo nejednoznačné identifikátory ====== ====== Žádné nebo nejednoznačné identifikátory ======
 +Častým problémem v datových sadách jsou odkazy na nedostatečně identifikované entity.
 +Příkladem může být datová sada příjemců dotací, kde příjemce dotace je identifikován pouze názvem, nikoliv pomocí IČO, nebo identifikace adresy několika textovými poli místo IRI adresního místa.
  
 +===== Řešení =====
 +Řešením je si nejprve rozmyslet, na které entity (firmy, školy, adresy, ...) se v datové sadě odkazuji, nejlépe formou konceptuálního modelu dat ([[https://cs.wikipedia.org/wiki/Entity-relationship_model|ER model]] či [[https://cs.wikipedia.org/wiki/Diagram_tříd|UML diagram tříd]]), který je následně součástí dokumentace datové sady.
 +Druhým krokem je zjistit, jak se tyto entity obvykle jednoznačně identifikují, a tyto identifikátory v datové sadě použít.
 +
 +Nejlepším řešením je použít globální jednoznačné identifikátory ve formě IRI tam, kde je primární správce dat o tomto typu entit již zadefinoval.
 +Příklady:
 +  * Registr územní identifikace, adres a nemovitostí RÚIAN, který pro každý územní prvek definuje jednoznačné IRI v metadatovém profilu, např. ''%%https://linked.cuzk.cz/resource/ruian/adresni-misto/16135661%%''
 +  * Registr práv a povinností, který definuje mimo jiné identifikátory pro Orgány veřejné moci, např. ''%%https://rpp-opendata.egon.gov.cz/odrpp/zdroj/orgán-veřejné-moci/00007064%%''
 +
 +Tam, kde správce ještě nedefinoval IRI pro globální jednoznačnou identifikaci jeho entit, je třeba o tuto definici správce požádat a do té doby prozatimně použít lokální identifikátor, např. ''00007064'' pro IČO, který je pro daný typ běžně používaný.
 +
 +===== Výhody identifikace entit pomocí IRI =====
 +  * Identifikátor je globální - datové sady, které ho používají, jsou automaticky integrovatelné
 +  * Není třeba vysvětlovat, čemu daný identifikátor náleží - je to jasné přímo z něj
 +  * V případě správné implementace lze v případě zájmu získat o dané entitě další informace pouze na základě jejího identifikátoru.
  • špatná-praxe/nejednoznačné-identifikátory.txt
  • Poslední úprava: 2020/06/03 09:37
  • (upraveno mimo DokuWiki)