Le traitement de données oblige à une distinction entre les données primaires et les métadonnées. Les métadonnées sont toutes les données décrivant les données primaires. Au lieu de "métadonnées", on peut utiliser également les deux termes "attributs" ou "caractéristiques", sémantiquement identiques. Au cours de la modélisation des données, on détermine quelles données primaires doivent ou peuvent être décrites par quelles métadonnées. Les métadonnées se décomposent en catégories de métadonnées individuelles. Pour chaque catégorie de métadonnées, on définie les valeurs autorisées.

Ce système peut être décrit à travers un exemple. Les données primaires sont des personnes. Chaque personne est décrite par son nom, prénom, lieu de naissance, date de naissance et couleur des yeux. Les valeurs autorisées peuvent être décrites de la manière suivante:

Nom : séquence de caractères composée de lettres
Prénom : séquence de caractères composée de lettres
Lieu de naissance : séquence de caractères composée de lettres
Date de naissance : date sous la forme année-mois-jour
Couleur des yeux : une valeur de la liste "marron, vert, bleu".

Chaque individu doit être clairement décrit par la somme de toutes les valeurs des différentes catégories de métadonnées. Dans le cas d'une duplicité dans l'ensemble des données (c'est-à-dire deux individus ayant des valeurs complètement identiques dans toutes les catégories de métadonnées), le système de métadonnées doit être considéré comme inadéquat et, par conséquence, modifié.