Mijn digitale gereedschapskist bevat tools, handige programmaatjes, om een specifiek probleem mee op te lossen of efficiënter te werken. Ik werk de lijst af en toe bij, kom gerust nog eens terug kijken.

Ik werk met Windows 10, maar voor veel tools zijn er ook Mac equivalenten. Mijn telefoon is een iPhone, als ik apps vermeld zijn ze voor iOS, maar voor Android kan je meestal dezelfde app of een equivalent vinden.


1. Favoriete en onmisbare tools

Onderstaande tools gebruik ik zelf heel regelmatig, ze zijn onmisbaar in mijn workflow. Sommige zijn misschien eerder voor geavanceerde computergebruikers andere zijn voor iedereen geschikt.
De meeste zijn gratis, sommige betalend (maar de bescheiden prijs meer dan waard).

Tekstvervanging

Text Expander tools kunnen je heel wat typewerk besparen. Je tikt een paar letters en de tool vervangt dat automatisch door een (veel) langer stuk tekst. Het werkt ongeveer zoals het bekende en soms vervloekte autocorrect op je smartphone of zoals de automatische spellingcorrectie. Alleen configureer en controleer je het hier volledig zelf en kan je vervangen door hele stukken tekst, niet alleen maar door één woord.

Zo heb ik er enkele om emails te ondertekenen: gp wordt “Groetjes, Peter”, vgpe wordt “Vriendelijke groeten, Peter Eyckerman”. En ander zoals @ wordt mijn emailadres, pe wordt mijn volledige naam, btw wordt mijn btwnummer, iban wordt mijn bankrekeningnummer en BIC, adres wordt mijn volledige adres, enz.

Met de tool die ik gebruik heb ik altijd de keuze om de vervanging te accepteren, door op de Shift-toets te drukken, of niet, door gewoon verder te typen. Automatische vervanging door een spatie te tikken achter het sleutelwoord vind ik storend. Bij doortypen krijg je dan ongewenste vervangingen, de reden waarom autocorrect zo kan ergeren.

Als je regelmatig dezelfde zinnen, stukken tekst of nummers moet intikken dan is dit heel handig en een grote tijdbespaarder.

Je kent het misschien van MS Office, waar het autotext genoemd wordt. Maar het is veel handiger om een tool te gebruiken die werkt op eender welke plaats waar je iets typt, of dat nu een email is of een Word-document, een ander soort tekstbestand of een formulier op een website.

Ik gebruikte lang PhraseExpander (betalend), maar de functionaliteit is veel te uitgebreid voor mij. Dus zocht ik een ander. Er zijn er verschillende, Google maar eens op text expander app of kijk in de lijst Text Expander Apps for Windows. Mijn voorwaarde is dat je de toets die de expansie activeert kan instellen op SHIFT, zoals bij PhraseExpander. Standaard werken de meeste met SPACE of ENTER of zelfs volledig automatisch. Maar dat vind ik vervelend omdat ik sommige afkortingen ook op zich wil kunnen gebruiken, zonder dat ze worden geëxpandeerd. Nu gebruik ik het gratis aText.

Bestanden beheren/hernoemen/organiseren/terugvinden

  • XYplorer is een vervanging (of aanvulling) op Windows Verkenner. Heel uitgebreid, met veel functionaliteit en aanpasbaar aan je eigen voorkeuren, met een krachtige hernoem functie. Maakt beter Personal Information Management mogelijk. Ik gebruik het dagelijks sinds 2017. [Gratis Testversie; Betalend]
    Ik heb het volledig ingesteld naar mijn noden. Bijvoorbeeld met kleurcodes die de “recentheid” van bestanden weergeven, hoe lichter groen hoe minder recent, lang gelden wordt grijs. Zo zie ik meteen aan de kleur aan welke bestanden ik vandaag, gisteren of langer geleden gewerkt heb. Dat spaart enorm veel zoektijd uit, want meestal heb je een recent bestand nodig. Je kan volledig je eigen kleurenfilters instellen.

XYplorer

Bestanden hernoemen

Eén bestand hernoemen is gauw gebeurd, maar als je een hele reeks één voor één moet hernoemen dan ben je lang bezig. Gelukkig zijn er tools om grote aantallen bestandsnamen in één keer aan te passen, precies zoals je wil. Bij de goede tools kan je altijd een voorbeeld zien van wat het resultaat zal zijn.

Het zal zeker nuttig zijn voor genealogen die hun bestandsnamen betekenisvol maken met allerlei gegevens.

  • “Batch hernoemen” in XYplorer (zie hoger) gebruik ik meestal voor relatief eenvoudige hernoemingen: bv. een vaste tekst toevoegen, of een volgnummer toevoegen. Maar je kan veel meer, zoals “zoeken en vervangen” en complexere hernoeming met “regex hernoemen”.
  • Advanced Renamer (bestanden hernoemen) Vrij duidelijk en gebruiksvriendelijk. Deze gebruik ik voor complexere hernoemingen met reguliere expressies, om bijvoorbeeld delen van de bestandsnaam om te wisselen. [Gratis]
  • Bulk Rename Utility (bestanden hernoemen) Krachtige tool, maar onduidelijke interface. Ik gebruik het alleen omdat het zowat de enige is die ook kan hernoemen o.b.v alle Windows File Properties. [Gratis]
  • PowerRenamer (bestanden hernoemen) is een onderdeel van Microsoft’s PowerToys. Het integreert in het rechtsklikmenu van de Verkenner. Wat meer uitleg: Windows 10 PowerToys: Alle tools uitgelegd. [Gratis]

Datasets bewerken

Lijsten en tabellen bewerken, filteren, sorteren, opkuisen, corrigeren, consolideren, aanvullen, … je wordt er wel eens mee geconfronteerd als je met genealogie bezig bent. Al is het maar een kolom met namen in hoofdletters vervangen door enkel beginhoofdletters of omgekeerd (dat is zo gebeurd in Notepad++).

  • MS Excel met de plugins Kutools en/of ASAP-utilities [Betalend]
  • OpenRefine [Gratis Open Source]
  • Notepad++ (uitgebreide teksteditor met regex zoeken en vervangen ingebouwd). Handig om txt, ini, csv, sql en andere platte tekstbestanden mee te maken en bewerken. [Gratis]
  • Bekijk ook mijn splitnames tool om namen te splitsen in voor- en achternaam.

Metadata/bestandseigenschappen bewerken

Metadata zijn een goede manier om gegevens over foto’s op te slaan in het fotobestand zelf.

  • Windows Verkenner (in elke Windows installatie beschikbaar): rechtsklik op een bestand, dan “Eigenschappen”, dan “Details”. Of zet het “Detailvenster” aan in het menu “Beeld”.
  • ExifToolGUI (metadata/tags/eigenschappen van fotobestanden bekijken en aanpassen) [Gratis]

Zoeken in de inhoud van tekstbestanden

  • GREP: om te zoeken in de inhoud van één of meer tekstbestanden tegelijk gebruik ik nog steeds Wingrep, dat helaas niet meer beschikbaar is. Je zal naar andere Windows grep tools moeten kijken.

PDF’s

Manipuleren

  • PDFSAM basic [Gratis Open Source] of PDFSAM Visual [Betalend] (splitsen, draaien, samenvoegen, pagina’s extraheren, herschikken, comprimeren, …). Onmisbaar als je met PDF’s moet werken.
  • IlovePDF (online tool, o.a. om PDF’s te comprimeren, splitsen, draaien, samenvoegen, omzetten naar andere formaten, …) [Gratis tot bepaald aantal/grootte]

Vergelijken

  • DiffPDF vergelijk twee PDF’s. Duid de verschillen aan tussen twee PDF’s, handig als je verschillende versies van een PDF hebt. [Gratis Open Source]

OCR op een PDF met afbeeldingen

  • NAPS2 (zie ook bij scannen). Importeer de PDF, en sla hem weer op als een nieuwe PDF. Zorg wel dat OCR aanstaat. In de nieuwe PDF kan je dan zoeken op tekst. [Gratis Open Source]

Scannen

  • Autosplitter (detecteert aparte foto’s als je er verschillende tegelijk scant, zet ze recht, en bewaart elk in een apart bestand. Je kan er ook automatisch kleuren van oude kleurfoto’s mee herstellen. Als je al scans van meerdere afbeeldingen op één blad hebt gemaakt kan je ze alsnog inladen en opsplitsen).
    Eén van mijn favoriete tools! Spaart enorm veel werk uit. [Gratis Testversie; Betalend]
  • NAPS2 Scannen en OCR tegelijk, met eender welke scanner (ook oude waar je geen software voor hebt). Rechtzetten en bijknippen. Opslaan als afbeelding of als PDF. [Gratis Open Source]

Beeldbewerking

  • PhotoFiltre 7 uitgebreide beeldbewerking met layers. Gratis Photoshop alternatief voor Windows, dat ik al vele jaren gebruik om scans allerhande te bewerken. [Gratis]
  • YASW is gemaakt voor correcties bij het digitaliseren van boeken. Ik gebruik het voor perspectiefcorrecties op foto’s of documenten die onder een hoek gefotografeerd zijn en daardoor een trapeziumvormig hebben. Maar je kan ook roteren (in sprongen van 90°) en bijknippen.
    Er staat een selectiekader klaar in de linker bovenhoek. Gewoon de hoeken naar de juiste plaats slepen (vier hoeken voor perspectief, twee voor bijknippen). Als je Preview aanvinkt zie je het resultaat. Vervolgens Export to om op te slaan in een folder. [Gratis]
  • PhotoPea is een heel uitgebreide en volledig online te gebruiken beeldbewerker. Beschikt over layers, correctietools, ook perspectiefcorrectie zit erin. [Gratis]
  • Snapseed (Android|iOS) uitgebreide beeldbewerkingsapp voor je tablet of smartphone. Ook perspectiefcorrectie is mogelijk. [Gratis]

Werken met fotocollecties

OCR op foto’s met tekst

  • NAPS2 (zie ook bij scannen). Importeer de afbeeldingen (scans van een tekstdocument bijvoorbeeld), en sla ze weer op als PDF. Zorg wel dat OCR aanstaat. In de PDF kan je dan zoeken op tekst. [Gratis Open Source]
  • Microsoft’s PowerToys Text Extractor. Win+Shift+T indrukken en je kan een stuk van (een afbeelding op) je scherm selecteren. Je krijgt de OCR-text terug op het klembord, klaar om te plakken. Dit is uiteraard alleen nuttig voor eens één of enkele afbeeldingen, maar wel snel en handig.

Familiefotocollectie visueel analyseren

Digitaal met fotocollecties werken, ze organiseren, verbanden ontdekken en personen vergelijken en identificeren, daarvoor moet je een overzicht hebben van alle foto’s en tegelijk snel op elke foto apart kunnen inzoomen. Je moet ze gemakkelijk kunnen verschuiven en er iets bij kunnen noteren.
In de fysieke wereld leg je je foto’s op een tafel, schuif je er naar believen mee rond en gebruik je post-it’s.
Digitaal kan dat via tools met een oneindig werkvlak (infinite canvas). Ik heb er zo enkele ontdekt. Een groot voordeel is dat je kostbare foto’s niet beschadigen, dat je er van overal aan kunt werken of naar kijken, dat je je werk gemakkelijk kunt delen en op afstand kunt samenwerken met meer dan één persoon, en dat je ze nooit moet opruimen om te kunnen eten :-)

  • Prezi is een online presentatietool met een oneindig groot werkvlak waar je naar believen op kan in- en uitzoomen. Je kan er presentaties à la PowerPoint op maken, maar dan met veel meer flexibiliteit. Ik gebruik het al jaren. Zie Mijn collectie fotoalbums voor voorbeelden.
  • Miro is een online whiteboard tool met een oneindig groot werkvlak waar je naar believen op kan in- en uitzoomen. Deze ben ik nog aan het uittesten, het zou wel eens nog beter kunnen zijn dan Prezi. Heeft ook apps om te installeren op je computer, Android en iOS.
  • OneNote van Microsoft installeer je op je computer. Het heeft ook een oneindig werkvlak, maar ik vindt het persoonlijk niet zo handig om mee te werken.
  • Focusky installeer je ook op je computer, het werkt net zoals Prezi en Miro, maar er staat niets online. Je hebt alleen een account nodig om te kunnen publiceren/printen. Ik ben er een fotoalbum mee aan het analyseren en ben er wel enthousiast over.


2. Nuttig om te leren

Reguliere Expressies (Regular Expressions)

Reguliere Expressies (regex) zijn patronen die je zelf schrijft om delen van een tekst te herkennen/zoeken/vervangen.

Het is een veel uitgebreidere en complexere variant van de wildcards of jokertekens ? en *. Die ken je wellicht van zoekformulieren om flexibeler te zoeken door 1 of meerdere tekens te vervangen door * of ?.

Kennis van reguliere expressies is eigenlijk onmisbaar als je snel en efficiënt wil “zoeken en vervangen” in tekst of tekst wil manipuleren.

Je kan er eenvoudige en ingewikkelde dingen mee doen: datum of adresformaten mee aanpassen of omvormen, lege regels verwijderen, regels met alleen cijfers verwijderen, een csv naar een sql formaat omzetten, ongewenste tekens uit tekst verwijderen, dubbele spaties verwijderen, …

Zie voorbeelden op de pagina Regex recepten voor genealogie.

Je kan regex gebruiken in een teksteditor (zoals Notepad++), maar ook hernoemtools en greptools ondersteunen het. Microsoft Office ondersteund helaas geen regex, maar LibreOffice wel.
Veel van de tools vermeld op deze pagina kan je oneindig veel krachtiger gebruiken als je iets kent van reguliere expressies.

Je vindt online gemakkelijk kant en klare regex voor veelvoorkomende patronen: http://regexlib.com/ Bv. om emailadressen, telefoonnummers, webadressen, datums, … te matchen.


3. Spoorzoeker tools

Door mijn achtergrond als softwareontwikkelaar schrijf ik regelmatig zelf nuttige tools of scripts, voor mezelf of voor anderen. Misschien kunnen ze je ook helpen.

Voor- en achternamen van elkaar scheiden

Joannes Josephus Van De Plas →  Joannes Josephus | Van De Plas

Een probleem dat ik regelmatig tegenkwam, en naar ik aanneem veel genealogische en heemkundige verenigingen die namenlijsten verwerken.

Ik maakte er een tooltje van dat iedereen online kan gebruiken, zelfs lijsten van 10.000den namen kunnen in enkele seconden worden gesplitst.

Probeer het eens uit: 

https://splitnames.petereyckerman.be/start


Bidprentjes automatisch indexeren met OCR:

Dit is een echt resultaat van de tool:
naam (volledig + gesplitst in voor en achternaam), geboorte- en overlijdensdatum en -plaats, naam partner.

Zie IndexScans voor meer info. Deze tool haalt de naam van de overledene, de geboorte- en overlijdensdata en -plaatsen en de naam van de partner uit gescande bidprentjes (JPG of al dan niet ge-OCRde PDF).

Namen worden correct herkend in meer dan 80% van de prentjes. Het herkenningspercentage hangt natuurlijk af van de kwaliteit van de scans, van de staat en de drukkwaliteit van het prentje, van de gebruikte lettertypes en van de kwaliteit van de OCR.

Het resultaat is een Excel-tabel (csv) die je snel kan overlopen om te controleren en aan te vullen aan de hand van de scans. Er is ook een viewer bij waarin je de gegevens naast de scans ziet en meteen kan corrigeren. Volledig indexeren gaat zo enorm snel.

Deze tool is is bedoeld om op een PC te installeren, maar er is ook een mogelijkheid om scans op te sturen en te laten indexeren. Er is een online demo van IndexScans beschikbaar, waarmee je zelf de indexering kunt testen.
Neem gerust contact op bij interesse of vragen: spoorzoeker@petereyckerman.be .

Ik beschik over snelle dubbelzijdige scanners met automatische invoer (Fujitsu fi-6670A en HP Scanjet Enterprise Flow 5000 s4) waarmee je snel hele stapels bidprentjes scant.


PDF splitsen om de twee pagina’s

Dit is gemaakt naar aanleiding van een probleem van een genealogische vereniging bij het scannen van hun collectie bidprentjes. Als je met een scanner met ADF bidprentjes of rouwbrieven scant naar PDF, met de bedoeling om de recto en verso scans bij elkaar te houden, dan kan je meestal niet anders dan

  • ofwel elke document apart één voor één te scannen
  • ofwel een stapel prentjes in één lange PDF scannen. Sommige scannersoftware kan geen aparte PDF’s maken met recto en verso zijde samen

Ga je voor één lange PDF, dan vond ik online een batch script dat elke pagina in een andere PDF stopt, dat heb ik aangepast zodat het om de twee pagina’s te splitst. Zo krijg je één PDF per recto-verso document.

Eerst download je Ghostscript AGPL Release “for Windows (64 bit)” via https://www.ghostscript.com/releases/gsdnld.html. Noteer het versienummer (in mijn geval 9.55.0). Installeer het in de standaard folder.

Open Kladblok in Windows (kan je intikken in het zoekvak) en plak er de onderstaande code in.

@echo off
chcp 65001
setlocal enabledelayedexpansion

set path=C:\Program Files\gs\gs9.55.0\lib;C:\Program Files\gs\gs9.55.0\bin;%path%

:start

echo Splitting "%~n1%~x1" after every two pages...
cd %~d1%~p1
rem getting number of pages of PDF with GhostScript
for /f "usebackq delims=" %%a in (`gswin64c -q -dNODISPLAY -dNOSAFER -c "(%~n1%~x1) (r) file runpdfbegin pdfpagecount = quit"`) do set "numpages=%%a"

for /L %%n in (1,2,%numpages%) do (
echo Extracting page %%n of %numpages%...
set /A lpage = %%n + 1
set /A filenr = lpage / 2
set "x=00!filenr!"
set "x=!x:~-3!"
IF /I "!lpage!" LEQ "%numpages%" gswin64c.exe -dNumRenderingThreads=2 -dBATCH -dNOPAUSE -dQUIET -dFirstPage=%%n -dLastPage=!lpage! -sDEVICE=pdfwrite -sOutputFile="%~d1%~p1%~n1-!x!.pdf" "%1"
)

shift
if NOT x%1==x goto start

In de regel met “set path=” pas je eventueel het versienummer (of het hele pad) aan, zodat het overeenkomt met de installatiefolder op je eigen computer.

Sla het bestand op je Bureaublad op als splitPDF.bat. Er mag geen “.txt” achter staan!

Nu kan je een PDF-bestand op deze bat file slepen en hij wordt automatisch gesplitst om de twee pagina’s. Zo heb je een PDF per recto-verso gescand document.


Opeenvolgende JPG’s samenvoegen in één bestand

Dit is gemaakt voor een heemkundige kring die hun collectie bidprentjes recto-verso scant met een flatbedscanner. Ze scannen 4 prentjes tegelijk, de scannersoftware splitst ze automatisch op in 4 aparte bestanden, dan de 4 prentjes omdraaien en de andere zijde scannen.

Je hebt nu twee bestanden per prentje, dat is op zich geen probleem, maar soms is het handiger om beide zijden in één bestand te hebben.

We gaan er van uit dat de scans meteen hernoemd worden waarbij recto en verso onderscheiden worden door een achtervoegsel (1) of (2). Je hebt dan bijvoorbeeld “Janssens Jan 19520918(1).jpg” en “Janssens Jan 19520918(2).jpg”.
Hoe kan je nu geautomatiseerd de recto en verso zijdes in één bestand onderbrengen: de recto en verso onder elkaar in één afbeelding.

Je kan dat doen met ImageMagick, een command-line programma om afbeeldingen te manipuleren. Als je dat in een script gebruikt kan je het automatiseren om bvb een hele folder tegelijk te verwerken.

Het script hieronder doet precies dat. De basis van het script vroeg ik overigens gewoon aan chatGPT, de eerste versie werkte niet, maar met wat doorvragen kwam dat in orde. Daarna deed ik zelf nog wat aanpassingen.

Open Kladblok in Windows (kan je intikken in het zoekvak) en plak er de onderstaande code in.

@echo off
setlocal enabledelayedexpansion

set "magickPath=C:\Program Files\ImageMagick-7.1.1-Q16-HDRI"

REM Check if any arguments are provided
if "%~1" == "" (
    echo Please drop a folder onto this script's shortcut.
    pause
    exit /b
)

IF NOT EXIST "%~1\merged" mkdir "%~1\merged"

set "counter=1"
set "file1="

for %%F in ("%~1\*.jpg") do (

	REM filter on filenames ending in the pattern "(<any number up to 2 digits>).jpg"
	REM You can change the regex pattern to make it more strict or more flexible.
	set "res=ECHO is off."
	for /f "tokens=*" %%a in ('echo "%%F"^| findstr /R "\([0-9][0-9]*\)\.jpg"') do (
		REM %%a contains result of findstr, or if findstr does not find anything "ECHO is off."
		set "res=%%a"
	)

	REM copy files that do not match the pattern in findstr
	if "!res!"=="ECHO is off." (
		echo %%F
		copy "%%F" "%~1\merged\"
	)
	
	if NOT "!res!"=="ECHO is off." (
		REM If file1 is empty, set it to the current file
		if not defined file1 (
			set "file1=%%F"
		) else (
			REM If file1 is not empty, it means we have two consecutive files
			set "file2=%%F"
			set "filename=%%~nF"
			set "resultfile=!filename!"
			for /f "tokens=1 delims=(" %%A in ("!filename!") do (
				set "resultfile=%%A"
			)

			REM remove up to 2 trailing spaces
			set "resultfile=!resultfile!##"
			set "resultfile=!resultfile:  ##=##!"
			set "resultfile=!resultfile: ##=##!"
			set "resultfile=!resultfile:##=!"

			REM -append places the files on top of each other
			REM change to +append to place them side by side
			"%magickPath%\magick" convert "!file1!" "!file2!" -append "%~1\merged\!resultfile!%%~xF"
			
			echo merged !resultfile!%%~xF

			set /a "counter+=1"
			set "file1="
		)
	)
)

echo Processing complete.
pause

In de regel met “set magickPath=” pas je het versienummer (of het hele pad) aan, zodat het overeenkomt met de installatiefolder van ImageMagick op je eigen computer.

Sla het bestand op je Bureaublad op als mergeScans.bat. Er mag geen “.txt” achter staan!

Nu kan je een folder op deze bat file slepen en het script plaats de samengevoegde bestanden in de subfolder “merged”.

Zet je ze liever naast elkaar ipv onder elkaar? Dan verander je -append in +append in de ImageMagick call.

Je kan het script natuurlijk aanpassen om andere onderscheidende aanduidingen dan (1) en (2) te verwerken. Dat doe je door het regex-patroon achter findstr aan te passen. Of je vraagt aan chatGPT om dat voor jou te doen :-)

Update 13/12/2023

Het script is aangepast zodat bestandsnamen zonder (1) of (2) gewoon gekopieerd worden naar de merged folder. Als je dat niet wil zet je REM voor de regel die met copy begint.

Bonus

Als je “-resize 1024×768^>” toevoegt aan de ImageMagick regel dan wordt het samengevoegde beeld bovendien verkleind naar een breedte van 1024 pixels of naar een hoogte van 768 pixels, wat best is om de afbeelding binnen die afmetingen te krijgen:

Als je dat ook voor niet-samengevoegde bestanden wil dan vervang je de regel 

copy "%%F" "%~1\merged\"

door

"%magickPath%\magick" convert "%%F" -resize 1024x768^> "%~1\merged\%%~nxF"

Je kan natuurlijk de afmetingen nemen die je zelf wil. Als je wil veranderen of experimenteren met ImageMagick resize zie https://imagemagick.org/Usage/resize/#shrink

Het “^” is een escape-teken voor Windows bat files, anders wordt “>” verkeerd geïnterpreteerd en werkt het niet.

De foto’s uit mijn collectie zijn in principe niet te koop, maar een ernstig bod kan ik altijd in overweging nemen.