Sicherheit

Die dunkle Seite des Telefons

9. März

Betrugsmaschen, die Sie kennen und vor denen Sie sich in Acht nehmen sollten

Weiterlesen
Alttext 0
Datenextraktion

Suchergebnisse als Excel-Tabelle

28. Januar

Eine Hands-On-Anleitung zum Sammeln und Archivieren von Internet-Suchen

Weiterlesen
Excel-Tabelle (Ausschnitt)

Die neuesten Beiträge

Kassenzettel als Datenquelle

Ich werfe Kassenbons in der Regel nicht weg, sondern lege sie in einem Archivkarton ab, um sie zur Hand zu haben, falls ich sie je nochmal brauchen sollte. Dies ist zwar selten der Fall, kommt aber immer wieder vor, und da ist man froh, wenn man auf einen Beleg zurückgreifen kann.

Als ich letzthin einmal den Karton leeren und die alten Kassenzettel entsorgen wollte, kam mir der Gedanke, sie, bevor sie endgültig vernichtet würden, als Datenquelle zu nutzen. Ein Kassenzettel ist ja im Prinzip nichts anderes als eine auf Papier ausgedruckte Tabelle, deren Spalten etwa Artikelbezeichnung, Menge, Stückpreis, zu bezahlender Preis und gegebenenfalls Rabatt, Steuer oder ähnlich heissen.

Das Problem mit Daten auf Papier ist, dass wir sie zuerst durch ein OCR-Programm jagen müssen, bevor wir sie in einer Datenbank ablegen oder als Excel Sheet öffnen können. Mein Favorit ist hier die Google Translate App. Sie erlaubt es, ein auf dem Handy gespeichertes Foto zu öffnen, und zieht dann aus dem Foto den Text mit grosser Treffsicherheit heraus. Was die App nicht so gut kann, ist Spalten erkennen. Da muss man dann einiges an Handarbeit investieren.

Alternativ habe ich die Free OCR API (Link: https://ocr.space/") benutzt, die den Text auch sehr gut erkennt und dazu noch eine Einteilung in Spalten beherrscht - wenn auch nicht ganz perfekt.

Als Drittes habe ich nach einer Smartphone App gesucht, die auf das Einscannen von Kassenbons spezialisiert ist und bin dank Heise (Link: Kassenbons scannen) fündig geworden. Die App meiner Wahl ist "epap" (Link: https://www.epap.app/") der Firma «epap Analytics GmbH» in Düsseldorf. Es handelt sich hierbei um eine Software zum Einlesen von Belegen und Führen eines Haushaltsbuchs. Für meine Zwecke interessant war allerdings in erster Linie die Funktion zum Herunterladen eingelesener Belege als CSV.

Die App erkennt Kassenbons ganz ausgezeichnet und ordnet auch die zun den Artikeln gehörenden Zahlen, soweit ich das überürüfen konnte, sauber ein. Der CSV-Download erfordert dennoch ein wenig Umformungsarbeit, aber diese hält sich in engen Grenzen und kann automatisiert werden.

Wie auch immer man das Bild in Text umgewandelt hat, es ist dringend geboten, die einzelnen Posten der Reihe nach durchzugehen und zu überprüfen. Doch, sobald diese Überprüfung abgeschlossen ist und allfällige Fehler korrigiert sind, hat man Daten, die sich für allerlei Zwecke nutzen lasse.