Metadata beschrijven een “ding”, een “gegevensobject”. Dat kan een digitaal of een fysiek ding zijn: een boek, een film, een foto, een auto, een voorouder, een Word document, een PDF, een databank, een ander computerbestand, enz.
Een heel abstracte definitie van metadata is “gegevens over gegevens”. Metadata maken het “ding” dat ze beschrijven beter handelbaar en toegankelijk, zowel voor mensen als voor computers.
Voorbeeld: Metadata voor een boek
zijn o.a. de gegevens die je in een bibliotheekcatalogus vindt: ISBN, Titel, ondertitel, reeksnaam, auteur(s), uitgeverij, publicatiedatum. Maar ook meer technische gegevens zoals vorm (harde kaft, e-boek, audioboek, …), taal, aantal pagina’s, afmetingen. En gegevens voor de werking van de bibliotheek zoals plaatsingsnummer, uitleenstatus, aanschafdatum, …
Voor een webwinkel zijn dat ook verkoopsprijs, BTW-percentage, beschikbaarheidsstatus, cover, flaptekst, backcover, leesfragment, recensie, quote, video, social media links, ...
Zoals je ziet hangen de bewaarde metadata af van het doel. Een bibliotheek zal gedeeltelijk andere metadata gebruiken dan een webwinkel of dan een fysieke boekenwinkel. Al zijn er wel een aantal overlappende basisgegevens die het boek identificeren.
Principes
Als je wil dat ooit iemand anders nog iets kan doen met je werk, moet je metadata sowieso zo veel mogelijk voor zichzelf spreken, en niet nog een extra interpretatiestap nodig hebben. Gebruik dus geen eigen codes of afkortingen die niet algemeen aanvaard/gekend zijn.
Als richtlijn gebruik je best de FAIR principes: Findability, Accessibility, Interoperability, Reuse. Te vertalen als Vindbaar, Toegankelijk, Uitwisselbaar, Herbruikbaar. Het zijn oorspronkelijk richtlijnen voor de beschrijving, opslag en publicatie van wetenschappelijke gegevens.
Samengevat komt FAIR neer op:
- F: voorzie voldoende uitgebreide metadata én een unieke en onveranderlijke identificatiecode (identifier).
- A: metadata zijn begrijpelijk en opvraagbaar voor mensen én computers. Ze blijven beschikbaar, ook als het gegevensobject zelf weg is.
- I: metadata worden volgens een breed aanvaard standaard formaat opgeslagen.
- R: metadata zijn nauwkeurig en relevant. Als je ze publiceert is dat met een duidelijke gebruikslicentie en met informatie over de herkomst.
Voor persoonlijk gebruik is dat misschien wat teveel, wat je zeker moet meepikken heb ik in vet gezet.
Een unieke en onveranderlijke identificatiecode kan zo eenvoudig zijn als een unieke bestandsnaam op basis van een datum en een tijdstip of nummer. Maar het kan ook moeilijk zijn, zoals een unieke identificatiecode voor een voorouder.
Zie ook Fotometadata.