Softwaretools of kortweg tools zijn handige programmaatjes om een specifiek probleem mee op te lossen.

  1. Mijn favorieten voor datasets, bestanden, metadata, zoeken, PDF’s, scannen, beeldbewerking, werken met fotocollecties.
  2. Nuttig om te leren: reguliere expressies
  3. Spoorzoeker tools (zelf ontwikkeld): namen splitsen, bidprentjes indexeren

1. Onmisbare tools van anderen

Onderstaande tools gebruik ik zelf heel regelmatig, ze zijn onmisbaar in mijn workflow. De meeste zijn gratis, sommige betalend (maar de bescheiden prijs meer dan waard).

Datasets bewerken

  • MS Excel met de plugins Kutools en/of ASAP-utilities [Betalend]
  • OpenRefine [Gratis Open Source]
  • Notepad++ (uitgebreide teksteditor met regex zoeken en vervangen ingebouwd). Handig om txt, ini, csv, sql en andere platte tekstbestanden mee te maken en bewerken. [Gratis]

Bestanden beheren/hernoemen/organiseren/terugvinden

  • XYplorer (vervanging of aanvulling op Windows Verkenner) Heel uitgebreid, ook krachtige hernoem functie. Maakt beter Personal Information Management mogelijk. Ik gebruik het dagelijks sinds 2017. [Gratis Testversie; Betalend]

Bestanden hernoemen

Metadata/bestandseigenschappen bewerken

  • Windows Verkenner (in elke Windows installatie beschikbaar)
  • ExifToolGUI (metadata/tags/eigenschappen van fotobestanden bekijken en aanpassen) [Gratis]

Zoeken in tekstbestanden

  • GREP: om te zoeken in één of meer tekstbestanden tegelijk gebruik ik nog steeds Wingrep, dat helaas niet meer beschikbaar is. Je zal naar andere Windows grep tools moeten kijken.

PDF’s manipuleren:

  • PDFSAM basic [Gratis Open Source] of PDFSAM Visual [Betalend] (splitsen, draaien, samenvoegen, pagina’s extraheren, herschikken, …).
  • IlovePDF (online tool, o.a. om PDF’s te comprimeren, splitsen, draaien, samenvoegen, omzetten naar andere formaten, …) [Gratis tot bepaald aantal/grootte]

Scannen

  • Autosplitter (detecteert aparte foto’s als je er verschillende tegelijk scant, zet ze recht, en bewaart elk in een apart bestand. Je kan er ook automatisch kleuren van oude kleurfoto’s mee herstellen. Als je al scans van meerdere afbeeldingen op één blad hebt gemaakt kan je ze alsnog inladen en opsplitsen). Eén van mijn favoriete tools! Spaart enorm veel werk uit. [Gratis Testversie; Betalend]
  • NAPS2 (Scannen en OCR tegelijk) [Gratis Open Source]

Beeldbewerking

  • PhotoFiltre 7 uitgebreide beeldbewerking met layers. Gratis Photoshop alternatief dat ik al jaaaren gebruik. [Gratis]
  • YASW is gemaakt voor correcties bij het digitaliseren van boeken. Je kan roteren (in sprongen van 90°), perspectief corrigeren en bijknippen. Er staat een selectiekader klaar in de linker bovenhoek. Gewoon de hoeken naar de juiste plaats slepen (vier hoeken voor perspectief, twee voor bijknippen). Als je Preview aanvinkt zie je het resultaat. Vervolgens Export to om op te slaan in een folder. [Gratis]

Werken met fotocollecties

  • Prezi is een online presentatietool met een oneindig groot werkvlak waar je naar believen op kan in- en uitzoomen. Je kan er presentaties à la PowerPoint op maken. Maar het is vooral de ideale tool om albums en collecties foto’s op te analyseren en identificeren.
    Zie Mijn collectie fotoalbums voor voorbeelden.

2. Nuttig om te leren

Reguliere Expressies (Regular Expressions)

Reguliere Expressies (regex) zijn patronen die je zelf schrijft om delen van een tekst te herkennen/zoeken/vervangen.

Het is een veel uitgebreidere en complexere variant van de wildcards of jokertekens ? en *. Die ken je wellicht van zoekformulieren om flexibeler te zoeken door 1 of meerdere tekens te vervangen.

Kennis van reguliere expressies is eigenlijk onmisbaar als je snel en efficiënt wil “zoeken en vervangen” in tekst of tekst wil manipuleren.

Dat kan in een teksteditor zijn, maar ook hernoemtools en greptools ondersteunen het. Veel van de tools hierboven kan je zo oneindig veel krachtiger gebruiken als je iets kent van reguliere expressies.


3. Spoorzoeker tools

Door mijn achtergrond als softwareprogrammeur schrijf ik soms zelf – voor mij – nuttige tools. Misschien kunnen ze je ook helpen.

Voor- en achternamen van elkaar scheiden

Joannes Josephus Van De Plas →  Joannes Josephus | Van De Plas

Een probleem dat ik regelmatig tegenkwam, en naar ik aanneem veel genealogische en heemkundige verenigingen die namenlijsten verwerken.

Ik maakte er een tooltje van dat iedereen online kan gebruiken, zelfs lijsten van 10.000den namen kunnen in enkele seconden worden gesplitst.

Probeer het eens uit: 

https://splitnames.petereyckerman.be/start

Bidprentjes automatisch indexeren met OCR


Dit is een echt resultaat van de tool:
naam (volledig + gesplitst in voor en achternaam), geboorte- en overlijdensdatum en -plaats, naam partner.

Deze tool haalt de naam van de overledene en de geboorte en overlijdensdata uit gescande bidprentjes (JPG of al dan niet ge-OCRde PDF). Vaak ook de plaats van geboorte en overlijden en de naam van de partner.

Namen worden correct herkend in ±90% van de prentjes, bijna 90% van de geboorte- en overlijdensdatums worden correct herkend. Het herkenningspercentage hangt natuurlijk af van de kwaliteit van de scans en van de kwaliteit van de OCR.

Het resultaat is een Excel-tabel (csv) die je snel kan overlopen om te controleren en aan te vullen aan de hand van de scans. Volledig indexeren gaat zo enorm snel.

Deze tool is is bedoeld om op een PC te installeren. Er is een online demo van IndexScans beschikbaar, waarmee je zelf de indexering kunt testen.
Neem gerust contact op bij interesse of vragen: spoorzoeker@petereyckerman.be .

Ik beschik ook over een snelle dubbelzijdige scanner (Fujitsu fi-6670A) waarmee je heel snel hele pakketten bidprentjes scant. In combinatie met NAPS2 (zie verder) geeft dat heel goede OCR resultaten.