Často chtějí poskytovatelé dat publikovat ne strukturovaná data, ale textové dokumenty. Často se stává, že se jedná o kolekci dokumentů stejného typu, např. kolekci smluv. Pokud by byla zveřejněna pouze kolekce, bylo by pro vývojáře aplikací nad takovou datovou sadou náročně vytvářet aplikace. Pro dokumenty v kolekci lze často nalézt společnou množinu atributů, které lze evidovat pro každý dokument v kolekci (např. pro každou smlouvu lze evidovat její název, datum uzavření, celkovou částku, IČ dodavatele, atd.). Pro takovou kolekci je vhodné vytvořit novou datovou sadu, která usnadní vývojářům případných aplikací zpracování zveřejněné kolekce.