Žádné nebo nejednoznačné identifikátory

Častým problémem v datových sadách jsou odkazy na nedostatečně identifikované entity. Příkladem může být datová sada příjemců dotací, kde příjemce dotace je identifikován pouze názvem, nikoliv pomocí IČO, nebo identifikace adresy několika textovými poli místo IRI adresního místa.

Řešení

Řešením je si nejprve rozmyslet, na které entity (firmy, školy, adresy, …) se v datové sadě odkazuji, nejlépe formou konceptuálního modelu dat (ER model či UML diagram tříd), který je následně součástí dokumentace datové sady. Druhým krokem je zjistit, jak se tyto entity obvykle jednoznačně identifikují, a tyto identifikátory v datové sadě použít.

Nejlepším řešením je použít globální jednoznačné identifikátory ve formě IRI tam, kde je primární správce dat o tomto typu entit již zadefinoval. Příklady:

Tam, kde správce ještě nedefinoval IRI pro globální jednoznačnou identifikaci jeho entit, je třeba o tuto definici správce požádat a do té doby prozatimně použít lokální identifikátor, např. 00007064 pro IČO, který je pro daný typ běžně používaný.

Výhody identifikace entit pomocí IRI