Geometrie

Mit Farben rechnen

8. September

Die Mathematik macht auch vor so etwas Sinnlichem wie der Farbe nicht halt und eröffnet allerlei Farbräume.

Weiterlesen
Ein Farbkreis, gebildet aus bunten Stiften
Websites

Nicht so toll?

7. Dezember

Die 5 wichtigsten Gründe, warum Ihre Website nicht so richtig ankommt, sondern floppt

Weiterlesen
Eine Person schaut auf eine unschöne Website

Die neuesten Beiträge

Daten aus Fotos

Seit um die Jahrtausendwende die ersten Mobiltelefone mit eingebauter Kamera auf den Markt kamen, ist die Zahl der Bilder explodiert. Das einzelne Bild verursacht keine nennenswerten Kosten, die Kamera ist immer griffbereit, und so wird geknipst, was das Zeug hält. Die populärsten Formen der Smartphonefotografie sind das Selfie, gefolgt von Essen, Urlaub und Haustieren.

Egal, was man fotografiert, mit der Zeit kommt ein ganz schönes Archiv zusammen. Bei vielen Leuten bleibt dieses Archiv auf dem Mobiltelefon und verschwindet für immer, wenn das Telefon den Geist aufgibt oder weitergegeben wird. Bewusstere Zeitgenossen sichern ihre Fotos auf einem externen Speichermedien oder in der Cloud.

Smartphone-Fotografie im beruflichen Umfeld

Auch im beruflichen Umfeld ist das Cameraphone nicht mehr wegzudenken. Sein Einsatz reicht vom Abfotografieren von Whiteboards bis zur systematischen Dokumentation von Baustellen oder Fahrzeugschäden, um nur zwei Beispiele zu nennen.

Bei beruflich genutzter Fotografie sollten die zentrale Ablage in einem gepflegten Archiv und die Sicherung auf mehreren Medien Standard sein. Dieses Archiv können wir, wenn uns nichts besseres einfällt, als Abstellkammer, wenn nicht gar als Friedhof unserer Fotos behandeln. Das ist der ungünstigste Fall.

Fotos als Datenquelle

Ein elektronisches Fotoarchiv umfasst grundlegend die Möglichkeit, Bilder nach Zeit und Ort zu gruppieren. Die Aufgabe, "Finde alle Fotos, die im Dezember 2022 in der Stadt Zug aufgenommen wurden", sollte mühelos durchführbar sein.

Um diese Aufgaben einfach und effizient zu bewältigen, sorgt das "Exchangeable Image File Format" (EXIF) vor. Neben fotografisch relevanten Details wie Kameramodell, Brennweite, Blende, Verschlusszeit und Abmessungen (Höhe/Breite) speichert EXIF auch Informationen über Zeit und Ort (GPS-Koordinaten) der Aufnahme.

Bereits diese Informationen machen das Fotoarchiv zu einer wertvollen Datenquelle. Es ist nicht immer erforderlich, den visuellen Inhalt des Bildes zu kennen, um wertvolle Informationen aus den Fotodaten extrahieren zu können.

Landkarte mit markierten Aufnahmeorten

Aus dem Archiv generierte Landkarte mit Marken für die Aufnahmeorte der Fotos (Screenshot)

Ein Szenario: Alle meine aufgenommenen Fotos befinden sich auf meiner Festplatte. Dies sind mehr als 100.000 Bilddateien. Jetzt kann ich unmittelbar eine Statistik generieren lassen, die angibt, wie viele Fotos pro Tag, Woche, Monat oder Jahr mit welchem Kameramodell aufgenommen wurden. Falls die Kamera GPS-fähig ist, können auch Aufnahmeorte ausgewertet werden.

Durch die Frage "Wie viele Fotos wurden zwischen März und Mai dieses Jahres an verschiedenen Orten aufgenommen?" kann ich eine Zusammenfassung meiner Reisen in diesen Monaten erhalten. Die Frage könnte auch lauten: "Wo habe ich mich von März bis Mai 2023 aufgehalten?"

Es ist leicht vorstellbar, dass wir diese Herangehensweise auch auf ein Team ausdehnen können. Jedes Teammitglied besitzt ein Smartphone und macht an jeder Station seiner Reise(n) mindestens ein Foto. Die Fotos werden bis spätestens zum Ende des Berichtszeitraums zentral gesammelt und ausgewertet. So erhalten wir einen automatisch erstellten monatlichen oder quartalsweisen Bericht über die Teamreisen.

Von den Metadaten zu den Daten

Bis hierhin haben wir mit den EXIF-Metadaten gearbeitet, und damit nicht die eigentlichen Daten, nämlich die Bilder, betrachtet. Wärend die Metadaten explizit dem Zweck dienen, Bilder maschinell erschliessbar zu machen, folgen die visuellen Informationen im Bild ganz anderen Gesetzen. Sie sind zwar digital - so lässt sich ein Foto etwa als eine zweidimensionale Matritze aus dreidimensionalen Vektoren lesen - aber die Digitalisierung berücksichtigt allein die optischen, nicht aber die semantischen Gegebenheiten der abgebildeten Szene.

Beispiel: Im nachfolgenden Foto sehen wir Holzblöcke, auf denen Äpfel platziert sind, wobei eine Beschriftung am Holzblock die Sorte des betreffenden Apfels nennt.

Verschiedene Apfelsorten, Äpfel und ihre Sortenbezeichnung

GPS: 47.5069655N, 9.4120429E; Datum der Aufnahme: 2019:09:28; Kameramodell: Huawei VTR-L09

Was wir als Mensch sehen, sieht die Maschine nicht. Für sie ist ein Bild zunächst nichts als eine Anordnung farbiger Punkte (Pixel), die in unserem Beispiel in 407 Zeilen zu je 720 Pixeln zerlegt wird und so den optischen Eindruck der Aufnahme vermittelt.

In den letzten Jahren hat jedoch die maschinelle Erkennung von Bildinhalten grosse Fortschritte gemacht. Durch maschinelles Lernen können Computer und Smartphones nun auch "verstehen", woraus der Inhalt eines Fotos besteht. Sie beherrschen sowohl die Erkennung von Personen, insbesondere von Gesichtern, als auch von Objekten - zum Beispiel Äpfel - und Szenen (etwa: Sonnenuntergang am Meer).

Das maschinelle Lernen öffnet die Tür zu einer Unzahl von interessanten Fotoauswertungen:

  • Gruppierung von Bildern nach dominanten Farben
  • Gruppierung nach Objekten und Objektkategorien
  • Automatische Entdeckung gesuchter Objekte
  • Automatisches Ausfiltern unerwünschter Inhalte
  • Nutzung von Fotos zur Qualitätskontrolle

Mit diesen Anwendungen wird sich der nächste Artikel beschäftigen.

Teaserbild «An assortment of colored pencils» by Chevre, Lizenz: CC BY-SA 3.0