Un diccionari de dades és un tipus de metadada que enllaça de manera organitzada els noms, definicions i característiques de cadascun dels camps o atributs d'un dataset. El seu objectiu és proveir un llenguatge comú entre l'autor de les dades i els possibles usuaris. A més, ens permeten entendre i interpretar un dataset en proporcionar informació bàsica sobre els camps o variables que conté. Brinden la següent informació:
- Què significa cada camp o variable.
- Quin tipus de dades conte
- Quins valors pot prendre, o si fa servir algun catàleg.
- Si conté informació pública, confidencial o reservada.
El diccionaris de dades estan dissenyats per facilitar la comprensió i proveir de sentir, per tant han de documentar l'existència, el significat i l'ús de cada element del dataset.
Les persones responsables de les dades han de mantenir actualitzat el contingut del diccionari dades, incloses les definicions i els valors.
Un codebook proporciona informació sobre l'estructura, el contingut i la disposició d'un fitxer de dades. Un codebook ben documentat conté informació que pretén ser completa i autoexplicativa per a cada variable d'un fitxer de dades.
Tot i que els llibres de codis varien àmpliament en qualitat i quantitat d'informació proporcionada, un llibre de codis típic inclou:
- Ubicacions de columnes i amplades per a cada variable.
- Definicions de diferents tipus de registre.
- Codis de resposta per a cada variable.
- Codis utilitzats per indicar no resposta i dades que falten.
- Preguntes exactes i patrons de salt utilitzats en una enquesta.
- Altres indicacions del contingut i característiques de cada variable.
El cos d'un codebook descriu el contingut del fitxer de dades.