Softwaretools of kortweg tools zijn handige programmaatjes om een specifiek probleem mee op te lossen.

  1. Mijn favorieten: voor datasets, bestanden, metadata, zoeken, PDF’s, scannen, beeldbewerking
  2. Nuttig om te leren: reguliere expressies
  3. Spoorzoeker tools: namen splitsen, bidprentjes indexeren

1. Onmisbare tools van anderen

Onderstaande tools gebruik ik zelf heel regelmatig, ze zijn onmisbaar in mijn workflow. De meeste zijn gratis, sommige betalend (maar de bescheiden prijs meer dan waard).

Datasets bewerken

Bestanden beheren/hernoemen/organiseren/terugvinden

  • XYplorer (vervanging of aanvulling op Windows Verkenner. Heel uitgebreid, ook krachtige hernoem functie. Maakt beter Personal Information Management mogelijk). [Gratis Testversie; Betalend]
  • Advanced Renamer (bestanden hernoemen. Vrij duidelijk en gebruiksvriendelijk.) [Gratis]
  • Bulk Rename Utility (bestanden hernoemen. Krachtige tool, maar onduidelijke interface. Gebruik het vooral omdat het zowat de enige is die ook kan hernoemen o.b.v alle Windows File Properties) [Gratis]

Metadata/bestandseigenschappen bewerken

  • Windows Verkenner (in elke Windows installatie beschikbaar)
  • ExifToolGUI (metadata/tags/eigenschappen van fotobestanden bekijken en aanpassen) [Gratis]

Zoeken in tekstbestanden

  • GREP: om te zoeken in één of meer tekstbestanden tegelijk gebruik ik nog steeds Wingrep, dat helaas niet meer beschikbaar is. Je zal naar andere Windows grep tools moeten kijken.

PDF’s manipuleren:

  • PDFSAM basic [Gratis Open Source]; PDFSAM Visual [Betalend] (splitsen, draaien, samenvoegen, pagina’s extraheren, herschikken, …)
  • IlovePDF (online tool, o.a. om PDF’s te comprimeren, splitsen, draaien, samenvoegen, omzetten naar andere formaten, …) [Gratis tot bepaald aantal/grootte]

Scannen

  • Autosplitter (detecteert aparte foto’s als je er verschillende tegelijk scant, zet ze recht, en bewaart elk in een apart bestand. Je kan er ook automatisch kleuren van oude kleurfoto’s mee herstellen. Als je al scans van meerdere afbeeldingen op één blad hebt gemaakt kan je ze alsnog inladen en opsplitsen). Eén van mijn favoriete tools! Spaart enorm veel werk uit. [Gratis Testversie; Betalend]
  • NAPS2 (Scannen en OCR tegelijk) [Gratis Open Source]

Beeldbewerking

  • PhotoFiltre 7 uitgebreide beeldbewerking met layers. Gratis Photoshop alternatief dat ik al jaaaren gebruik. [Gratis]

2. Nuttig om te leren

Reguliere Expressies (Regular Expressions)

Reguliere Expressies (regex) zijn patronen die je zelf schrijft om delen van een tekst te herkennen.

Het is een veel uitgebreidere en complexere variant van de wildcards of jokertekens ‘?’ en ‘*’. Die ken je wellicht van zoekformulieren om flexibeler te zoeken door 1 of meerdere tekens te vervangen.

Kennis van reguliere expressies is eigenlijk onmisbaar als je snel en efficiënt wil zoeken en vervangen in tekst of tekst wil manipuleren.

Dat kan in een teksteditor zijn, maar ook hernoemtools en greptools ondersteunen het. Veel van de tools hierboven kan je zo oneindig veel krachtiger gebruiken als je iets kent van reguliere expressies.

Heel uitgebreide info over de syntax vind je op Regular-Expressions.info.

Regex voor beginners: https://regexone.com/

Regex patronen om te hergebruiken: http://regexlib.com/ Bv. om emailadressen, telefoonnummers, webadressen, datums, … te matchen.


3. Spoorzoeker tools

Door mijn achtergrond als softwareprogrammeur schrijf ik soms zelf – voor mij – nuttige tools. Misschien kunnen ze je ook helpen.

Voor- en achternamen van elkaar scheiden

Joannes Josephus Van De Plas →  Joannes Josephus | Van De Plas

Een probleem dat ik regelmatig tegenkwam, en naar ik aanneem veel genealogische en heemkundige verenigingen die namenlijsten verwerken.

Ik maakte er een tooltje van dat iedereen online kan gebruiken, zelfs lijsten van 10.000den namen kunnen in enkele seconden worden gesplitst.

Probeer het eens uit: 

https://splitnames.petereyckerman.be/start

Bidprentjes automatisch indexeren met OCR


Dit is een echt resultaat van de tool:
naam (volledig + gesplitst in voor en achternaam), geboorte- en overlijdensdatum en -plaats, naam partner.

Deze tool haalt de naam van de overledene en de geboorte en overlijdensdata uit gescande bidprentjes (JPG of al dan niet ge-OCRde PDF). Vaak ook de plaats van geboorte en overlijden en de naam van de partner.

Namen worden correct herkend in ±80% van de prentjes, bijna 90% van de geboorte- en overlijdensdatums worden correct herkend. Het herkenningspercentage hangt natuurlijk af van de kwaliteit van de scans en van de kwaliteit van de OCR.

Het resultaat is een Excel-tabel (csv) die je snel kan overlopen om te controleren en aan te vullen aan de hand van de scans. Volledig indexeren gaat zo enorm snel.

Deze tool is niet online beschikbaar, hij is bedoeld om op een PC te installeren. De tool werkt, maar is qua gebruikerservaring nog in een rudimentair en eerder experimenteel alfa stadium.
Maar neem gerust contact op bij interesse: spoorzoeker@petereyckerman.be .

Ik beschik ook over een snelle dubbelzijdige scanner (Fujitsu fi-6670A) waarmee je heel snel hele pakketten bidprentjes scant. In combinatie met NAPS2 (zie verder) geeft dat heel goede OCR resultaten.