Trend

Web Scraping

4. November

Wie man allerlei Daten aus öffentlichen Quellen sammelt und was man mit ihnen alles anfangen kann

Weiterlesen
teaser image 1
Daten

Pandas

3. September

Das Analyse-Multitalent, das auch vor grossen Datenmengen nicht zurückschreckt

Weiterlesen
teaser image 2

Die neuesten Beiträge

Flugzeuge beobachten

Flugzeuge aus der Nähe zu sehen, fasziniert viele Menschen, und wer in Zürich wohnt, hat es nicht weit bis zu einer Stelle, von der aus er die Starts und Landungen am Flughafen Zürich Kloten ungestört beobachten kann.

Ich wollte vor Kurzem für ein bestimmtes Projekt Fotos von Flugzeugen machen und ging dazu auf die Besucherterrasse des Zürcher Flughafens. Von dort hat man einen guten Blick auf das Rollfeld und kann Maschinen fotografieren, die heranrollen oder sich Richtung Startbahn wegbewegen. Leider war Piste 16/34, die direkt an der Besucherterrasse vorbeiführt, nur wenig benutz. Die meisten Flüge hoben von Startbahn 28 ab, für die es andere günstige Standorte gibt, so zum Beispiel den Spotter-Treff beim «Heligrill» an der Klotenerstrasse in Rümlang.

Welchen Flugzeugtyp und welche Airline werde ich in Zürich am häufigsten zu sehen bekommen?

Es war mir klar, dass ich am Flughafen Zürich hauptsächlich Maschinen der SWISS sehen würde, aber wie viele das im Verhältnis zu anderen Airlines sein würden und welche Flugzeuge ich antreffen könnte, hätte ich nicht zu beziffern gewagt.

Swiss Airbus A220-100 HB-JBG

Der Airbus A220-100 mit dem Kennzeichen HB-JBG macht sich am 7.9.2022 auf den Weg zum London City Airport (LCY)

Nach Hause zurückgekehrt, machte ich mich auf die Suche nach Daten und wurde zunächst bei FlightAware fündig. Dort konnte ich mit etwas Web Scraping alle ankommenden Flüge der letzten 24 Stunden in eine Tabelle eintragen und hatte dann 363 Datensätze mit Information über die Flugnummer, den Flugzeugtyp, den Flughafen, von dem der Flug nach Zürich ging, und die Zeit von Start und Landung.

Eine solche Tabelle überblickt man allerdings nicht. Ausserdem ist in ihr die gewünsche Information, nämlich wieviele Flüge von der Swiss International Air Lines und wieviele von den anderen Fluggesellschaften durchgeführt werden, nur implizit enthalten und muss erst noch herausdestilliert werden.

Mit anderen Worten: Wir müssen die Daten aggregieren. Das lässt sich über eine Kreuztabelle schnell erledigen, wenn man damit zufrieden ist, nur den ICAO Airline Code zu benutzen. Will man hingegen wissen, wie die Airline hinter dem Code heisst, ist eine Datenbankabfrage geboten. Für eine solche brauchen wir die Liste der Airline Codes, wie wir sie beispielsweise aud Wikipedia finden: List of Airline Codes.

Für die hier gestellte Aufgabe erübrigt sich der Einsatz eines MySQL Servers. Google Sheets reich vollkommen aus. Die Daten von Wikipedia lassen sich mit der Anweisung =IMPORTHTML("https://en.wikipedia.org/wiki/List_of_airline_codes","Table",1) in das Spreadsheet holen und die SQL-Abfrage =QUERY(Airlines!$A$2:$C$6304,"SELECT C WHERE B = '"&$P2&"' LIMIT 1") bringt das gewünsche Ergebnis. Nun erstellen wir noch die Kreuztabelle und schon haben wir das Ergebnis: Die SWISS liegt erwartungsgemäss mit einem knappen Drittel (31%) vorn, gefolgt von Helvetic (11%) und der SWISS-Tochter Edelweiss (7%); zusammen bestreiten diese drei Carrier die Hälfte der Flüge, der Rest verteilt sich auf 70 weitere Fluggesellschaften.

Auf analogem Weg liess sich eine Rangliste der Länder erstellen, aus denen die Flieger kamen: An der Spitze liegt Deutschland, gefolgt von Spanien, Italien, Grossbritannien, Griechenland, Frankreich, USA, Niederlande, Portugal, Türkei, um nur die Top 10 zu nennen.

Am Rande bemerkt: Um den jeweiligen Flugplatz einem Land zuordnen zu können, habe ich die Liste der Airportcodes heruntergeladen und dabei erfahren, dass es weltweit über 57 Tausend Flugplätze mit einem solchen Code gibt.

Die letzte Frage, die mich interessierte, begtraf die Flugzeugtypen. Und da war ich dann doch ein wenig überrascht: Airbus liegt mit einem Anteil von 60% ganz vorne, an zweiter Stelle Embraer mit 18%. Das heisst, mehr als drei Viertel aller Flüge nutzten Maschinen von nur zwei Herstellern. Aufgeschlüsselt nach Flugzeugtypen zeigt sich, dass der Airbus A320 mit 25% der Platzhirsch ist, abgeschlagen der A220 (8%) und der A319 (7%) auf den Plätzen 2 und 3.

Caveat: Die Zahlen, die ich hier anführe, sind ohne jegliche Gewähr und ich bin mir vollkommen bewusst, dass es sich, selbst wenn wir davon ausgehen dürfen, dass die Zahlen korrekt sind, nur um einen Schnappschuss handelt, der keine weit reichenden Schlüsse zulässt. Überhaupt nicht berücksichtigt ist die Saisonalität der Daten. Die hier genannten Zahlen beziehen sich auf den Donnerstag 22. bis Freitag 23. September 2022. An anderen Wochentagen und in den verschiedenen Jahreszeiten dürfte es spezifische Abweichungen geben, die bei diesem Schnappschuss aussen vor bleiben.

Es war auch nicht mein Anliegen, eine zuverlässige Statistik zum Flugverkehr in Zürich / Schweiz zu erstellen - das erledigt schon das Bundesamt für Statistik unter Linien- und Charterverkehr -, sondern ich konnte hier zwei Interessen verbinden: Reisen und Daten. Bei den Daten ging es um Web Scraping, Python, Pandas, Queries und Google Sheets.