Mijn digitale gereedschapskist bevat tools, handige programmaatjes, om een specifiek probleem mee op te lossen of efficiënter te werken. Ik werk de lijst af en toe bij, kom gerust nog eens terug kijken.

Ik werk met Windows 10, maar voor veel tools zijn er ook Mac equivalenten. Mijn telefoon is een iPhone, als ik apps vermeld zijn ze voor iOS, maar voor Android kan je meestal dezelfde app of een equivalent vinden.

  1. Mijn favorieten voor datasets, teksten, bestanden, metadata, zoeken, PDF’s, scannen, beeldbewerking, werken met fotocollecties.
  2. Nuttig om te leren: reguliere expressies
  3. Spoorzoeker tools (zelf ontwikkeld):
    1. namen splitsen,
    2. bidprentjes indexeren,
    3. PDF splitsen om de twee pagina’s

1. Favoriete en onmisbare tools

Onderstaande tools gebruik ik zelf heel regelmatig, ze zijn onmisbaar in mijn workflow. Sommige zijn misschien eerder voor geavanceerde computergebruikers andere zijn voor iedereen geschikt.
De meeste zijn gratis, sommige betalend (maar de bescheiden prijs meer dan waard).

Tekstvervanging

Text Expander tools kunnen je heel wat typewerk besparen. Je tikt een paar letters en de tool vervangt dat automatisch door een (veel) langer stuk tekst. Het werkt ongeveer zoals het bekende en soms vervloekte autocorrect op je smartphone of zoals de automatische spellingcorrectie. Alleen configureer en controleer je het hier volledig zelf en kan je vervangen door hele stukken tekst, niet alleen maar door één woord.

Zo heb ik er enkele om emails te ondertekenen: gp wordt “Groetjes, Peter”, vgpe wordt “Vriendelijke groeten, Peter Eyckerman”. En ander zoals @ wordt mijn emailadres, pe wordt mijn volledige naam, btw wordt mijn btwnummer, iban wordt mijn bankrekeningnummer en BIC, adres wordt mijn volledige adres, enz.

Met de tool die ik gebruik heb ik altijd de keuze om de vervanging te accepteren, door op de Shift-toets te drukken, of niet, door gewoon verder te typen. Automatische vervanging door een spatie te tikken achter het sleutelwoord vind ik storend. Bij doortypen krijg je dan ongewenste vervangingen, de reden waarom autocorrect zo kan ergeren.

Als je regelmatig dezelfde zinnen, stukken tekst of nummers moet intikken dan is dit heel handig en een grote tijdbespaarder.

Je kent het misschien van MS Office, waar het autotext genoemd wordt. Maar het is veel handiger om een tool te gebruiken die werkt op eender welke plaats waar je iets typt, of dat nu een email is of een Word-document, een ander soort tekstbestand of een formulier op een website.

Ik gebruik PhraseExpander (betalend), maar er zijn er veel andere, ook gratis. Google maar eens op text expander app of kijk in de lijst Text Expander Apps for Windows.

Bestanden beheren/hernoemen/organiseren/terugvinden

  • XYplorer is een vervanging (of aanvulling) op Windows Verkenner. Heel uitgebreid, met veel functionaliteit en aanpasbaar aan je eigen voorkeuren, met een krachtige hernoem functie. Maakt beter Personal Information Management mogelijk. Ik gebruik het dagelijks sinds 2017. [Gratis Testversie; Betalend]
    Ik heb het volledig ingesteld naar mijn noden. Bijvoorbeeld met kleurcodes die de “recentheid” van bestanden weergeven, hoe lichter groen hoe minder recent, lang gelden wordt grijs. Zo zie ik meteen aan de kleur aan welke bestanden ik vandaag, gisteren of langer geleden gewerkt heb. Dat spaart enorm veel zoektijd uit, want meestal heb je een recent bestand nodig. Je kan volledig je eigen kleurenfilters instellen.
XYplorer

Bestanden hernoemen

Eén bestand hernoemen is gauw gebeurd, maar als je een hele reeks één voor één moet hernoemen dan ben je lang bezig. Gelukkig zijn er tools om grote aantallen bestandsnamen in één keer aan te passen, precies zoals je wil. Bij de goede tools kan je altijd een voorbeeld zien van wat het resultaat zal zijn.

Het zal zeker nuttig zijn voor genealogen die hun bestandsnamen betekenisvol maken met allerlei gegevens.

  • “Batch hernoemen” in XYplorer (zie hoger) gebruik ik meestal voor relatief eenvoudige hernoemingen: bv. een vaste tekst toevoegen, of een volgnummer toevoegen. Maar je kan veel meer, zoals “zoeken en vervangen” en complexere hernoeming met “regex hernoemen”.
  • Advanced Renamer (bestanden hernoemen) Vrij duidelijk en gebruiksvriendelijk. Deze gebruik ik voor complexere hernoemingen met reguliere expressies, om bijvoorbeeld delen van de bestandsnaam om te wisselen. [Gratis]
  • Bulk Rename Utility (bestanden hernoemen) Krachtige tool, maar onduidelijke interface. Ik gebruik het alleen omdat het zowat de enige is die ook kan hernoemen o.b.v alle Windows File Properties. [Gratis]
  • PowerRenamer (bestanden hernoemen) is een onderdeel van Microsoft’s PowerToys. Het integreert in het rechtsklikmenu van de Verkenner. Wat meer uitleg: Windows 10 PowerToys: Alle tools uitgelegd. [Gratis]

Datasets bewerken

Lijsten en tabellen bewerken, filteren, sorteren, opkuisen, corrigeren, consolideren, aanvullen, … je wordt er wel eens mee geconfronteerd als je met genealogie bezig bent. Al is het maar een kolom met namen in hoofdletters vervangen door enkel beginhoofdletters of omgekeerd (dat is zo gebeurd in Notepad++).

  • MS Excel met de plugins Kutools en/of ASAP-utilities [Betalend]
  • OpenRefine [Gratis Open Source]
  • Notepad++ (uitgebreide teksteditor met regex zoeken en vervangen ingebouwd). Handig om txt, ini, csv, sql en andere platte tekstbestanden mee te maken en bewerken. [Gratis]
  • Bekijk ook mijn splitnames tool om namen te splitsen in voor- en achternaam.

Metadata/bestandseigenschappen bewerken

Metadata zijn een goede manier om gegevens over foto’s op te slaan in het fotobestand zelf.

  • Windows Verkenner (in elke Windows installatie beschikbaar): rechtsklik op een bestand, dan “Eigenschappen”, dan “Details”. Of zet het “Detailvenster” aan in het menu “Beeld”.
  • ExifToolGUI (metadata/tags/eigenschappen van fotobestanden bekijken en aanpassen) [Gratis]

Zoeken in de inhoud van tekstbestanden

  • GREP: om te zoeken in de inhoud van één of meer tekstbestanden tegelijk gebruik ik nog steeds Wingrep, dat helaas niet meer beschikbaar is. Je zal naar andere Windows grep tools moeten kijken.

PDF’s

Manipuleren

  • PDFSAM basic [Gratis Open Source] of PDFSAM Visual [Betalend] (splitsen, draaien, samenvoegen, pagina’s extraheren, herschikken, comprimeren, …). Onmisbaar als je met PDF’s moet werken.
  • IlovePDF (online tool, o.a. om PDF’s te comprimeren, splitsen, draaien, samenvoegen, omzetten naar andere formaten, …) [Gratis tot bepaald aantal/grootte]

Vergelijken

  • DiffPDF vergelijk twee PDF’s. Duid de verschillen aan tussen twee PDF’s, handig als je verschillende versies van een PDF hebt. [Gratis Open Source]

Scannen

  • Autosplitter (detecteert aparte foto’s als je er verschillende tegelijk scant, zet ze recht, en bewaart elk in een apart bestand. Je kan er ook automatisch kleuren van oude kleurfoto’s mee herstellen. Als je al scans van meerdere afbeeldingen op één blad hebt gemaakt kan je ze alsnog inladen en opsplitsen).
    Eén van mijn favoriete tools! Spaart enorm veel werk uit. [Gratis Testversie; Betalend]
  • NAPS2 Scannen en OCR tegelijk, met eender welke scanner (ook oude waar je geen software voor hebt). Rechtzetten en bijknippen. Opslaan als afbeelding of als PDF. [Gratis Open Source]

Beeldbewerking

  • PhotoFiltre 7 uitgebreide beeldbewerking met layers. Gratis Photoshop alternatief voor Windows, dat ik al vele jaren gebruik om scans allerhande te bewerken. [Gratis]
  • YASW is gemaakt voor correcties bij het digitaliseren van boeken. Ik gebruik het voor perspectiefcorrecties op foto’s of documenten die onder een hoek gefotografeerd zijn en daardoor een trapeziumvormig hebben. Maar je kan ook roteren (in sprongen van 90°) en bijknippen.
    Er staat een selectiekader klaar in de linker bovenhoek. Gewoon de hoeken naar de juiste plaats slepen (vier hoeken voor perspectief, twee voor bijknippen). Als je Preview aanvinkt zie je het resultaat. Vervolgens Export to om op te slaan in een folder. [Gratis]
  • PhotoPea is een heel uitgebreide en volledig online te gebruiken beeldbewerker. Beschikt over layers, correctietools, ook perspectiefcorrectie zit erin. [Gratis]
  • Snapseed (Android|iOS) uitgebreide beeldbewerkingsapp voor je tablet of smartphone. Ook perspectiefcorrectie is mogelijk. [Gratis]

Werken met fotocollecties

Digitaal met fotocollecties werken, ze organiseren, verbanden ontdekken en personen vergelijken en identificeren, daarvoor moet je een overzicht hebben van alle foto’s en tegelijk snel op elke foto apart kunnen inzoomen. Je moet ze gemakkelijk kunnen verschuiven en er iets bij kunnen noteren.
In de fysieke wereld leg je je foto’s op een tafel, schuif je er naar believen mee rond en gebruik je post-it’s.
Digitaal kan dat via tools met een oneindig werkvlak (infinite canvas). Ik heb er zo enkele ontdekt. Een groot voordeel is dat je kostbare foto’s niet beschadigen, dat je er van overal aan kunt werken of naar kijken, dat je je werk gemakkelijk kunt delen en op afstand kunt samenwerken met meer dan één persoon, en dat je ze nooit moet opruimen om te kunnen eten :-)

  • Prezi is een online presentatietool met een oneindig groot werkvlak waar je naar believen op kan in- en uitzoomen. Je kan er presentaties à la PowerPoint op maken, maar dan met veel meer flexibiliteit. Ik gebruik het al jaren. Zie Mijn collectie fotoalbums voor voorbeelden.
  • Miro is een online whiteboard tool met een oneindig groot werkvlak waar je naar believen op kan in- en uitzoomen. Deze ben ik nog aan het uittesten, het zou wel eens nog beter kunnen zijn dan Prezi. Heeft ook apps om te installeren op je computer, Android en iOS.
  • OneNote van Microsoft installeer je op je computer. Het heeft ook een oneindig werkvlak, maar ik vindt het persoonlijk niet zo handig om mee te werken.

2. Nuttig om te leren

Reguliere Expressies (Regular Expressions)

Reguliere Expressies (regex) zijn patronen die je zelf schrijft om delen van een tekst te herkennen/zoeken/vervangen.

Het is een veel uitgebreidere en complexere variant van de wildcards of jokertekens ? en *. Die ken je wellicht van zoekformulieren om flexibeler te zoeken door 1 of meerdere tekens te vervangen.

Kennis van reguliere expressies is eigenlijk onmisbaar als je snel en efficiënt wil “zoeken en vervangen” in tekst of tekst wil manipuleren.

Dat kan in een teksteditor zijn, maar ook hernoemtools en greptools ondersteunen het. Veel van de tools hierboven kan je zo oneindig veel krachtiger gebruiken als je iets kent van reguliere expressies.

Je vindt online gemakkelijk kant en klare regex voor veelvoorkomende patronen: http://regexlib.com/ Bv. om emailadressen, telefoonnummers, webadressen, datums, … te matchen.


3. Spoorzoeker tools

Door mijn achtergrond als softwareprogrammeur schrijf ik soms zelf – voor mij – nuttige tools. Misschien kunnen ze je ook helpen.

Voor- en achternamen van elkaar scheiden

Joannes Josephus Van De Plas →  Joannes Josephus | Van De Plas

Een probleem dat ik regelmatig tegenkwam, en naar ik aanneem veel genealogische en heemkundige verenigingen die namenlijsten verwerken.

Ik maakte er een tooltje van dat iedereen online kan gebruiken, zelfs lijsten van 10.000den namen kunnen in enkele seconden worden gesplitst.

Probeer het eens uit: 

https://splitnames.petereyckerman.be/start


Bidprentjes automatisch indexeren met OCR


Dit is een echt resultaat van de tool:
naam (volledig + gesplitst in voor en achternaam), geboorte- en overlijdensdatum en -plaats, naam partner.

Deze tool haalt de naam van de overledene, de geboorte- en overlijdensdata en -plaatsen en de naam van de partner uit gescande bidprentjes (JPG of al dan niet ge-OCRde PDF).

Namen worden correct herkend in meer dan 80% van de prentjes. Het herkenningspercentage hangt natuurlijk af van de kwaliteit van de scans, van de staat en de drukkwaliteit van het prentje, van de gebruikte lettertypes en van de kwaliteit van de OCR.

Het resultaat is een Excel-tabel (csv) die je snel kan overlopen om te controleren en aan te vullen aan de hand van de scans. Er is ook een viewer bij waarin je de gegevens naast de scans ziet en meteen kan corrigeren. Volledig indexeren gaat zo enorm snel.

Deze tool is is bedoeld om op een PC te installeren. Er is een online demo van IndexScans beschikbaar, waarmee je zelf de indexering kunt testen.
Neem gerust contact op bij interesse of vragen: spoorzoeker@petereyckerman.be .

Ik beschik over snelle dubbelzijdige scanners met automatische invoer (Fujitsu fi-6670A en HP Scanjet Enterprise Flow 5000 s4) waarmee je snel hele stapels bidprentjes scant.


PDF splitsen om de twee pagina’s

Als je met een scanner met ADF bidprentjes of rouwbrieven scant naar PDF, met de bedoeling om de recto en verso scans bij elkaar te houden, dan kan je meestal niet anders dan

  • ofwel elke document apart één voor één te scannen
  • ofwel van een stapel prentjes in één lange PDF te scannen. De meeste scannersoftware kan geen aparte PDF’s maken met recto en verso zijde samen

Ik vond online een batch script dat elke pagina in een andere PDF stopt, dat heb ik aangepast zodat het om de twee pagina’s te splitst.

Eerst download je Ghostscript AGPL Release “for Windows (64 bit)” via https://www.ghostscript.com/releases/gsdnld.html. Noteer het versienummer (in mijn geval 9.55.0). Installeer het in de standaard folder.

Open Kladblok in Windows (kan je intikken in het zoekvak) en plak er de onderstaande code in.

@echo off
chcp 65001
setlocal enabledelayedexpansion

set path=C:\Program Files\gs\gs9.55.0\lib;C:\Program Files\gs\gs9.55.0\bin;%path%

:start

echo Splitting "%~n1%~x1" after every two pages...
cd %~d1%~p1
rem getting number of pages of PDF with GhostScript
for /f "usebackq delims=" %%a in (`gswin64c -q -dNODISPLAY -dNOSAFER -c "(%~n1%~x1) (r) file runpdfbegin pdfpagecount = quit"`) do set "numpages=%%a"

for /L %%n in (1,2,%numpages%) do (
echo Extracting page %%n of %numpages%...
set /A lpage = %%n + 1
set /A filenr = lpage / 2
set "x=00!filenr!"
set "x=!x:~-3!"
IF /I "!lpage!" LEQ "%numpages%" gswin64c.exe -dNumRenderingThreads=2 -dBATCH -dNOPAUSE -dQUIET -dFirstPage=%%n -dLastPage=!lpage! -sDEVICE=pdfwrite -sOutputFile="%~d1%~p1%~n1-!x!.pdf" "%1"
)

shift
if NOT x%1==x goto start

In de regel met “set path=” pas je eventueel het versienummer (of het hele pad) aan, zodat het overeenkomt met de installatiefolder op je eigen computer.

Sla het bestand op je Bureaublad op als splitPDF.bat. Er mag geen “.txt” achter staan!

Nu kan je een PDF-bestand op deze bat file slepen en hij wordt automatisch gesplitst om de twee pagina’s. Zo heb je een PDF per recto-verso gescand document.