Quando ci si occupa di dati è bene delineare la differenza che intercorre tra dati primari e metadati. Questi ultimi si caratterizzano, infatti, come dati che descrivono i dati primari. Al posto del termine "metadati" possono anche essere impiegati i termini "attributi" o "caratteristiche", dal medesimo significato. Nel corso della modellazione dei dati, si stabilisce da quali ''metadati'' i dati primari debbano o possano essere descritti. La categoria "metadati" si suddivide ulteriormente in singole sottocategorie di metadati. Per ogni categoria di metadati sono definiti i valori ammessi.

Per concretizzare questo concetto, ci serviremo di un esempio. Ammettiamo che i dati primari indichino delle persone. Ogni persona è descritta attraverso il suo cognome, il suo nome, il luogo e la data di nascita così come il colore degli occhi. I valori ammissibili possono, dunque, essere descritti come segue:

Cognome: catena di caratteri composta da lettere;
Nome: catena di caratteri composta da lettere;
Luogo di nascita: catena di caratteri composta da lettere;
Data di nascita: data nella forma JJJJ-MM-TT;
Colore degli occhi: un valore della lista "marrone, verde, blu".

La somma di ogni valore delle diverse categorie di metadati dovrebbe permettere di descrivere univocamente la persona in questione. Nel momento in cui ci si dovesse trovare di fronte ad una duplicità nell'insieme di dati, ossia nel caso in cui due individui dispongano di valori completamente identici in tutte le categorie di metadati, lo schema di metadati dovrà essere considerato come inadeguato e, di conseguenza, modificato.