Elke digitale afbeelding (foto, scan, …) beschikt over de mogelijkheid om het wie, wat, waar, wanneer en waarom van de foto op te slaan. Net alsof je het op de achterkant van een fotoafdruk zou schrijven.

Metadata is de “digitale achterkant” van de foto.

Die Metadata blijven in principe voor altijd bij de foto want ze zijn in het fotobestand opgeslagen. Het is de beste manier om alles wat je over een digitale of gedigitaliseerde foto weet door te geven aan volgende generaties.

Let wel op met sociale media. Facebook, Instagram, etc. verwijderen de Metadata als je er een foto op zet. Dat is dus geen goede manier om foto’s inclusief Metadata met iemand te delen.

Zie Metadata voor een algemenere uitleg, want niet alleen foto’s hebben Metadata.

Welke metadata zitten er al in mijn foto’s?

Als je er niet mee inzit om je foto te uploaden dan kan je de online metadataviewer Get Metadata gebruiken. Snel, volledig en gemakkelijk als je nieuwsgierig bent.

Met Windows Verkenner kan je een beperkte selectie van de Metadata zien. Rechtsklik op een bestand en kies in het popupmenu onderaan Eigenschappen. Vervolgens klik je op het tabblad Details. De meeste Metadata die je daar ziet kan je ook invullen of wijzigen.

Als je dat al hebt kan je met goede fotobewerkingsoftware of goede fotobeheersoftware ook Metadata zien (niet noodzakelijk alles, enkel wat die software ondersteund).

Voor de doorsnee familiekundige is dat ruim voldoende. Voor de technisch onderlegde uitzonderingen (zoals mezelf) : om echt alle Metadata te kunnen zien en manipuleren op je eigen computer is er maar één optie: ExifTool. Dat overigens door veel andere software in de achtergrond gebruikt wordt. Dat is heel krachtig, maar niet eenvoudig in gebruik voor een doorsnee computergebruiker.

Hoe stop ik metadata in mijn foto’s?

Als je Metadata wil gebruiken om je foto’s te organiseren dan gebruik best meteen fotobeheersoftware.
Maar het gaat ook met Windows Verkenner als je van een minimalistische aanpak met enkele beperkingen houdt. Zelf gebruik ik het vaak.

Als je bereid bent wat tijd te steken in het leren omgaan met echte fotobeheersoftware dan is in eerste instantie het gratis Adobe Bridge een aanrader. Bridge werkt rechtstreeks op de Metadata in je bestanden. Het werkt dus niet met een database zoals Lightroom of met een mix van beide zoals ACDSee Studio.

In Histories Magazine verscheen een artikel Informatie inbedden in foto’s. Het artikel is wel interessant, maar meer gericht op instellingen dan op privépersonen. Je kan er wel het gebruik van ExifTool zien.

Standaarden

In een digitale afbeelding kan je volgende metadatastandaarden terugvinden:

  • EXIF: technische Metadata die meestal door de camera ingevuld wordt, zoals belichtingstijd en diafragmaopening, GPS coördinaten, camera model, … Al is ook artiest en copyright voorzien. Deze Metadata worden in een eigen formaat opgeslagen in het bestand.
  • IPTC: beschrijvende Metadataset die oorspronkelijk uit de perswereld komt. Bevat velden zoals omschrijving, auteur, trefwoorden, onderwerp, opnamedatum, plaats, titel, bron, … De oude versie (IPTC IIM) wordt in een eigen formaat opgeslagen, de nieuwe versie (IPTC Core en uitbreidingen, sinds 2004) wordt opgeslagen in het XMP-formaat. Maar voor compatibiliteit worden de IIM Metadata door de meeste programma’s gesynchroniseerd met de Core Metadata in XMPBekijk de IPTC specificatie.

Metadata worden opgeslagen in XMP, een flexibel XML-formaat, oorspronkelijk door Adobe ontwikkeld:

  • XMP: moderne IPTC Metadata worden in dit formaat opgeslagen, maar in principe kan iedereen er in opslaan wat hij wil.
    En dat gebeurt ook. Verschillende bedrijven gebruiken hun eigen metadata-uitbreidingen in XMP (Adobe photoshop, ACDSee, Microsoft, …). Niet alle software ondersteund alle metadata-uitbreidingen. Dat zorgt bijvoorbeeld voor problemen bij het overdragen van niet-standaard gegevens als je overschakelt naar een andere software (gezichtsherkenningsgegevens bijvoorbeeld).

Sommige bestaande en nieuwe metadatastandaarden werden opgenomen in de IPTC specificatie:

  • Dublin Core: wijdverbreide beschrijvende metadataset die oorspronkelijk uit de bibliotheekwereld komt. Vijf basisvelden zijn opgenomen in IPTC Core: Titel (title), Trefwoorden (subject), Maker (creator), Copyright (rights), Beschrijving (description).
  • Photoshop: enkele velden afkomstig van Adobe producten (Photoshop, Bridge, Illustrator, InDesign, Lightroom, …) zijn opgenomen in IPTC Core:
    • City, State, Country (deze zijn wat dubbelzinnig en het is duidelijker om de IPTC Extension velden Location Created en Location Shown te gebruiken)
    • DateCreated (datum wanneer de originele foto gemaakt is)
    • Source (bron, van wie of waar kreeg je deze foto)
    • en minder belangrijk vanuit genealogisch standpunt: AuthorsPosition, Credit, CaptionWriter, Headline, Instructions, TransmissionReference,
  • XMP Rights: dit is ook afkomstig van Adobe en beschrijft de rechten op foto’s. Maar twee metadatavelden zijn opgenomen in IPTC (UsageTerms en WebStatement).
  • PLUS: deze uitgebreide copyright en gebruikslicentie informatie is opgenomen in de IPTC Extension.

Meer informatie op photometadata.org.

Familiefoto’s en metadata

Je wil je digitale en gedigitaliseerde familiefoto’s met alle beschrijvingen over wat er op te zien is kunnen doorgeven aan de volgende generaties. Fotometadata zijn daarvoor de aangewezen manier omdat ze onafscheidelijk zijn van de foto zelf.

Ze kunnen wel gewist worden: opzettelijk door jezelf, onopzettelijk door slecht gemaakte fotosoftware, bij delen op sociale media. Uitzonderlijk worden de Metadata opgeslagen in een sidecar-file.

Er zijn wel nogal wat valkuilen en problemen.

De software

  • Niet alle software ondersteund/leest/schrijft alle standaard metadatavelden, gebruikt ze op de juiste manier, synchroniseert tussen EXIF en IPTC velden met dezelfde betekenis, enz.
  • Veel softwaremakers hebben de neiging om eigen metadatavelden te maken en die niet te synchroniseren met bestaande velden voor hetzelfde doel. Soms is dat om erg praktische redenen, bijvoorbeeld software die hiërarchische sleutelwoorden of categorieën voorziet kan die niet zomaar wegschrijven in het Dublin Core subject veld.
  • Fotomanagementsoftware bestaat in twee soorten: met database en zonder.
    • Die zonder database werkt rechtstreeks op de Metadata die in je fotobestanden staan, die blijven dus altijd up-to-date met wat je verandert. Je geraakt in principe geen werk kwijt als je zou overschakelen naar andere software.
    • Die met database hebben vaak veel uitgebreidere mogelijkheden ivm Metadata dan in de standaarden voorzien zijn. Ze slaan alle Metadata op in een eigen database, en met wat geluk of met de juiste instellingen kan je die ook (gedeeltelijk) wegschrijven als Metadata in de fotobestanden zelf. Als je dat niet doet, of dat werkt maar gedeeltelijk, dan verlies je al je werk zodra je overstapt naar andere software of zelfs gewoon maar je foto’s aan iemand anders doorstuurt of er een back-up van maakt.

IPTC biedt een overzicht van welke software IPTC geheel of gedeeltelijk ondersteund. Dat zijn niet de gegevens van de meest recente versies van al die software, dus dat kan veranderd zijn. Maar het geeft meteen een overzicht van welke fotobeheersoftware je kan uittesten.

Identificatie van personen

Eén van de belangrijkste dingen die een genealoog of familiearchivaris naast opnamedatum, -plaats en een beschrijving van de gebeurtenis wil kunnen bijhouden is de identificatie van de personen op een foto.

Het eenvoudigste kan je dat doen in het titelveld (het Dublin Core Title veld) of in het beschrijvingsveld (het Dublin Core Description veld), dat wordt altijd en overal ondersteund. Met dien verstande dat als je Metadata in Windows verkenner invoert, je alleen het Titel-veld moet gebruiken (vergeet Opmerkingen en Onderwerp).
In die titel/beschrijving (denk aan het klassieke onderschrift bij een foto) kan je gewoon de namen zetten, of bij meerdere personen de klassieke vlnr (van links naar rechts en van boven naar onder) volgorde gebruiken.

Je kan ook de namen als labels/tags/sleutelwoorden in het Dublin Core Subject veld zetten (Labels-veld in Windows), maar de volgorde wordt niet gegarandeerd behouden omdat die velden in XMP opgenomen worden als rdf:bag (een “zak” ongeordende woorden) en niet als rdf:seq (een opeenvolging in vaste volgorde).

Er zijn ook wel specifieke velden voorzien in de IPTC extension specificatie:

  • PersonInImage (Person Shown): een eenvoudige lijst met namen.
  • PersonInImageWDetails: een lijst personen, waarbij elke persoon volgende eigenschappen kan hebben: karakteristieken (een reeks termen uit een “gecontroleerd vocabularium”, dat is een vaste woordenlijst, thesaurus, taxonomie, o.i.d.), beschrijving, unieke identificatiecode en naam.

Deze velden kan je, in software die het ondersteund, gebruiken om personen te beschrijven, de identificatiecode zou je zelfs naar een persoonscode in je genealogie kunnen laten verwijzen. Maar zodra er meer personen op een foto staan kan je niet aangeven wie waar precies op de foto staat.

Nochtans kan dat wel: als je al software met gezichtsherkenning gebruikt hebt dan weet je dat die een kader tekent rond elk gezicht en dat je daar dan een naam aan kan geven. Maar hoe dat in de Metadata wordt opgeslagen is helaas (nog) niet gestandaardiseerd.

Gezichtsinformatie is eigenlijk een specifiek geval van het benoemen van een deel (regio) van een foto. Er bestaan verschillende systemen om zowel de plaats van iets op de foto (het gezicht in ons geval) als de bijbehorende naam op te slaan als Metadata. Maar er is geen standaard voor. Het dichtste bij een standaard was misschien wel MWG-RS (Metadata Working Group RegionInfo Struct). De MWG (waarin Adobe, Apple, Canon, Microsoft, Nokia en Sony zaten) zou nog bestaan, al is hun website al lange tijd down.

  • Met het ter ziele gegane Google Picasa moest je de herkende gezichten expliciet opslaan in de bestanden, anders bleven ze in de Picasa database. Ze werden dan als MWG-RS opgeslagen.
  • Het eveneens ter ziele gegane Microsoft Photo Gallery sloeg gezichten op in MP (Microsoft Photo People Tags, Microsoft RegionInfo Struct). Ondanks deelname aan de MWG gebruikte Microsoft toch een eigen formaat.
  • ACDSee gebruikt zijn eigen ACDSEE-RS formaat.
  • IPTC heeft in zijn laatste update ook Image Regions voorzien, die te gebruiken zijn in combinatie met PersonInImage. Dit geeft dezelfde functionaliteit als de drie bovenstaande. Maar IPTC is wel belangrijk als standaard, dus hopelijk wordt dat opgepikt door de softwaremakers.
  • Wat doet Adobe? Dat is altijd een goede richtlijn als de facto leider wat betreft alles wat met digitale foto’s te maken heeft. Adobe heeft in het verleden ook al heel wat standaarden geïntroduceerd. Lightroom slaat gezichten in MWG-RS op, de Photoshop Elements Organizer slaat geen gezichten op in de bestanden, die blijven in de database.

Bij online diensten en sociale media die gezichten kunnen herkennen (Facebook, Google Foto’s, …) is er de kwestie van privacy waardoor Facebook en Google gezichtsherkenning standaard hebben uitgeschakeld in Europa. Dat is wel te omzeilen als je zou willen.

Waar het op je eigen PC leuk en nuttig kan zijn om gezichtsherkenning te gebruiken, zou ik het bij online fotodiensten niet aanbevelen en zeker niet als duurzame oplossing. Hoogstwaarschijnlijk worden gezichtsgegevens ook niet opgeslagen in het bestand als je ze weer download. Je werk gaat dus verloren.

Conclusie
Omdat er momenteel helemaal geen standaard is, raad ik af om alleen op gezichtsherkenning te vertrouwen om duurzaam personen in een foto op te slaan. Maar die komt er hopelijk snel met de Family History Metadata Working Group (FHMWG).

Welke metadatavelden moet je precies invullen?

Er zijn heel wat verschillende datumvelden:

  • in IPTC: creatiedatum (datum genomen), creatiedatum voor een kunstwerk, benaderende creatiedatum voor een kunstwerk.
    Voor een foto zou je best de datums voor een kunstwerk gebruiken, alleen al omdat je dan ook een benaderende datum kan geven of alleen een jaartal, of een periode. Het gewone veld voor creatiedatum moet in de meeste software namelijk een volledige bestaande datum zijn, dag-maand-jaar, en vaak nog met uren, minuten, seconden.
  • in EXIF: ModifyDate (datum gewijzigd), DateTimeOriginal (datum van opname), Createdate (=DateTimeDigitized, datum van digitalisering), verschillende aanvullende velden voor de tijdszone, en mogelijk nog camerafabrikantafhankelijke of toepassingsafhankelijke velden.
  • En nog andere die je in diverse producentspecifieke Metadata aantreft. Zie exiftool.org.

Ook voor het ingeven van geografische locaties heb je verschillende velden, van plaatsnamen in tekstvorm tot geografische coördinaten.

Een groot probleem is dat al die velden niet in alle software voor hetzelfde gebruikt worden, of gebruikt worden tout-court, en niet altijd gesynchroniseerd worden met elkaar als ze hetzelfde betekenen.

Om daar wat aan te verhelpen voor de genealogische gemeenschap is in mei 2020 de Family History Metadata Working Group (FHMWG) opgericht. Het is een Amerikaans initiatief met FamilySearch, de Family History Information Standards Organisation (FHISO) en commerciële bedrijven die gericht zijn op familiefoto’s of persoonlijke digitale archivering (MemoryWeb, Vivid-Pix, The Permanent Legacy Foundation). Ik ben heel benieuwd of daar iets concreets uit gaat komen.

Er zou alleszins interesse zijn om FHMWG als proefproject te gebruiken voor het Data Transfer Project, waarin Google, Facebook, Microsoft, Twitter en Apple zitten [bron: Interview met Christopher Desmond van MemoryWeb].

Advies?

Als advies kan ik voorlopig meegeven om je bij voorkeur ofwel aan de basisvelden te houden in eender welke software die je kiest, ofwel volledig te gaan voor een bepaalde software die al lang bestaat en waarvan je zeker weet dat die nog lang gaat bestaan (iets als Lightroom van Adobe bijvoorbeeld, of ACDSee Photo Studio).

Vergeet niet dat je gewoon Windows Verkenner of Apple Finder kunt gebruiken om Metadata in te voeren en erop te zoeken.

Als tussenstap is ook Adobe Bridge interessant, dat is volledig gratis (ze gaan je wel een abonnement proberen aan te smeren, maar dat kan je negeren) en niet databasegebaseerd. Het vraagt wel wat inwerktijd, maar dat geldt voor al dergelijke software.

 

Lees ook: