Waisenkinder
5. Februar 2024
Zusammenfassung
Seiten, auf die kein interner Link zeigt, nennt man verwaist. Solche Seiten werden von Besuchern nicht gefunden, und möglicherweise auch nicht von Suchmaschinen. Enthalten sie wichtige und wertvolle Inhalte, stellen sie sozusagen ihr Licht unter den Scheffel — schade drum! Enthalten sie unwichtige und überflüssige Inhalte, sind sie bloss Ballast— weg damit!
Dieser Beitrag zeigt, mit welchen Mitteln Sie verwaiste Seiten finden können und geht im letzten Teil auf die Frage ein, ob solche Seiten Ihre Bemühungen, von den Suchmaschinen als relevant eingestuft zu werden, konterkarieren.
Was versteht man unter «verwaiste Seiten»?
Verwaiste Seiten einer Website sind einzelne Seiten, die nicht mit anderen Seiten der Website verlinkt sind, so dass sie weder über die Navigation noch über Links im Text erreichbar sind. Das Fehlen interner Links hat zur Folge, dass Suchmaschinen und Benutzer diese Seiten kaum finden können. Und es bedeutet auch: Suchmaschinen wie Google werden diese Seiten wahrscheinlich nicht indizieren und folglich auch nicht als Suchergebnis anzeigen können.
Wie kommt es, dass Seiten verwaist sind?
Verwaiste Seiten können Ergebnis einer mangelhaften Planung der Site-Struktur oder Folge schlechter Wartung sein. Oft kommen sie dadurch zustande, dass Seiten und damit auch die in ihnen enthaltenen Links auf andere Seiten gelöscht werden. Bei Websites mit nur wenigen Seiten — siehe obiges Schaubild — fällt es wahrscheinlich auf, wenn eine bestimmte Seite nirgends mehr verlinkt ist, doch bei grösseren Sites mit unzähligen internen Links geht die Übersicht ganz schnell verloren und es tummeln sich im Verborgenen mancherlei Waisen.
Wie lässt es sich vermeiden, dass Seiten ohne interne Links bleiben?
Um verwaiste Seiten auf einer Website zu finden, können Sie verschiedene Tools und Methoden verwenden. Hier sind einige gängige Methoden:
- Manuelle Überprüfung: Schreiben Sie die Namen aller Seiten auf einen Block. Gehen Sie dann jede Seite durch und machen Sie bei jedem internen Link, den Sie finden, einen Strich beim Namen der Seite, auf die der Link zeigt. Bleibt am Ende ein Seitenname ohne Strich, haben Sie eine verwaiste Seite gefunden.
- Überprüfung per Shell Script: Schreiben Sie mit dem Linux-Kommandozeilen-Befehl
ls *.html | sed 's/\s\+/\n/g' > alle-seiten.txt
die Liste aller vorhandenen HTML-Seiten in eine Textdatei.
Extrahieren Sie mit dem Befehlgrep -r href *.html | sed 's/^.*href="\([^"]\+\)".*/\1/g' | grep -E '^[a-z0-9.-]+$' | sort | uniq > verlinkte-seiten.txt
alle internen Links aus Ihren Seiten und speichern Sie sie ebenfalls als Textdatei ab.
Mit dem Befehlcomm -23 <(alle-seiten.txt) <(sort verlinkte-seiten.txt)
suchen Sie dann diejenigen Seiten heraus, auf die kein Link zeigt. Diese Methode ist einfach und auch bei einer sehr grossen Zahl von Seiten blitzschnell, sie setzt aber voraus, dass die Links sehr einfach strukturiert sind und keine relativen Pfade verwendet werden. - Überprüfung anhand der Sitemap: Wenn Sie für Ihre Website eine XML-Sitemap haben, überprüfen Sie diese, um zu sehen, ob alle Seiten Ihrer Website darin aufgeführt sind. So erhalten Sie einen grundlegenden Überblick über potenziell verwaiste Seiten.
- Überprüfung per Python Script: Mit Python und der Bibliothek «Beautiful Soup» ist es einfach, Seiten von einem externen oder internen Server abzurufen und aus ihnen alle Links zu extrahieren. Ausserdem verfügt Python über Funktionen, die es ermöglichen, relative Pfade in absolute umzuschreiben, so dass alle Seiten und alle internen Linkziele normalisiert und damit vergleichbar werden. Und schliesslich steht mit den Bibliotheken «Numpy» und «Pandas» ein sehr handliches Werzeug zum Umgang mit Matrizen zur Verfügung. Wenn man auf einem Rechner arbeitet, auf dem Python installiert ist, ist also diese Methode das Mittel der Wahl, doch selbstverständlich können auch alle anderen Programmiersprachen eingesetzt werden.
- SEO-Crawler: Tools wie Screaming Frog, SiteBulb und SEMrush bieten Website-Crawler, die Ihre Website scannen und verwaiste Seiten identifizieren. Sie lassen sich oft mit Google Analytics-Daten integrieren, um ein umfassenderes Bild zu erhalten.
- Google Analytics: Suchen Sie nach dem Bericht "Aufrufe nach Seitenpfad und Bildschirmklasse". Sortieren Sie aufsteigend nach Seitenaufrufen und suchen Sie nach Seiten mit sehr geringem oder gar keinem Traffic. Dies ist zwar nicht narrensicher, kann aber bei umfangreichen Websites mit viel Traffic auf einfache Weise potenzielle Waisenkinder aufzeigen.
- CMS-Plugins: Wenn Sie ein beliebtes CMS wie WordPress verwenden, können verschiedene Plugins verwaiste Seiten innerhalb Ihrer Plattform identifizieren.
Wenn Sie dann am Ende eine Liste verwaister oder vermutlich verwaister Seiten haben:
- Analysieren Sie jede Seite: Nicht jede verwaiste Seite ist ein Problem. Bei einigen von ihnen ist vielleicht der Inhalt nicht mehr aktuell, andere sind vielleich Landing Pages oder absichtlich versteckte Seiten. Entscheiden Sie für jede Seite, ob sie verlinkt oder umgeleitet werden muss oder aber gelöscht werden kann.
- Korrigieren Sie die interne Verlinkung: Fügen Sie für wertvolle Seiten relevante interne Links von anderen Seiten Ihrer Website hinzu, um die Navigation und die Suchmaschinenoptimierung zu verbessern.
- Passen Sie Ihre Sitemap an: Gelöschte oder umgeleitete Seiten gehören nicht in die Sitemap.
Zusätzliche Tipps:
- Führen Sie regelmässig Überprüfungen durch: Verwaiste Seiten können im Laufe der Zeit immer wieder einmal auftauchen. Planen Sie daher periodische Überprüfungen (z.B. einmal im Quartal), um eine saubere Website-Struktur zu behalten.
- Berücksichtigen Sie technische Aspekte: Stellen Sie sicher, dass weder
robots.txt
nochnoindex
-Direktiven die Crawler daran hindern, Ihre Seiten zu finden. - Konzentrieren Sie sich auf die Benutzerfreundlichkeit: Sorgen Sie dafür, dass menschliche Besucher Ihrer Website alle wertvollen Inhalte finden können, nicht nur Suchmaschinen und Web Scraper.
Inwiefern sind verwaiste Seiten ein Problem für die Suchmaschinenoptimierung?
Verwaiste Seiten können sich negativ auf die Suchmaschinenoptimierung auswirken, aber das Ausmass der Auswirkungen hängt von mehreren Faktoren ab::
- Anzahl der verwaisten Seiten: Es ist unwahrscheinlich, dass einige wenige verwaiste Seiten grössere Probleme verursachen, aber eine grosse Anzahl kann einen erheblichen negativen Einfluss haben.
- Qualität der verwaisten Seiten: Wenn die verwaisten Seiten hochwertig und für Ihre Zielgruppe relevant sind, sind die negativen Auswirkungen grösser. Umgekehrt sind qualitativ minderwertige oder irrelevante Seiten möglicherweise nicht so schädlich.
- Crawlbarkeit und Indexierbarkeit: Auch wenn eine Seite verwaist ist, kann sie von Suchmaschinen gecrawlt und indiziert werden. Ohne interne Links ist es jedoch unwahrscheinlicher, dass sie häufig gecrawlt wird und einen niedrigeren PageRank hat, was zu schlechteren Rankings führt.
- Allgemeine Gesundheit der Website: Eine Website mit mehreren anderen SEO-Problemen kann durch verwaiste Seiten stärker beeinträchtigt werden als eine gut optimierte Website.
- Reduziertes Crawl-Budget: Suchmaschinen haben ein begrenztes Crawl-Budget für jede Website. Verwaiste Seiten verbrauchen dieses Budget, ohne zur Suchmaschinenoptimierung beizutragen, und behindern möglicherweise das Crawlen anderer wichtiger Seiten.
- Niedrigerer PageRank: Der PageRank, ein Schlüsselfaktor in Googles Algorithmus, wird durch interne Links beeinflusst. Verwaiste Seiten haben keinen PageRank-Fluss, so dass es für sie schwieriger ist, gut zu ranken.
- Schlechte Benutzerfreundlichkeit: Nutzer können über Suchmaschinen auf verwaiste Seiten stossen, aber die Navigation zu anderen relevanten Inhalten auf Ihrer Website kann ohne interne Links schwierig sein. Dies kann zu Frustration und hohen Absprungraten führen.
- Verpasste Ranking-Chancen: Wertvolle verwaiste Seiten könnten zu Ihrer Suchmaschinenoptimierung beitragen, wenn sie mit internen Links richtig in die Struktur Ihrer Website integriert werden.
- Potenzielles Spam-Signal: Eine grosse Anzahl verwaister Seiten könnte Suchmaschinen aufhorchen lassen und möglicherweise Spam-Filter auslösen.
Es ist jedoch wichtig, daran zu denken, dass verwaiste Seiten nicht unbedingt eine SEO-Katastrophe sind. Wenn Sie die potenziellen Auswirkungen kennen und Massnahmen ergreifen, um sie zu beseitigen, können Sie die negativen Folgen minimieren und sie sogar für positive Ergebnisse nutzen. So können Sie beispielsweise eine irrelevante verwaiste Seite in eine wertvolle Seite umwandeln, indem Sie relevante Inhalte und interne Links hinzufügen.
Letztlich kommt es darauf an, Ihre verwaisten Seiten einzeln zu analysieren, ihre potenziellen Auswirkungen zu verstehen und geeignete Massnahmen zu ergreifen, um Ihre Website-Struktur und Ihre SEO-Leistung insgesamt zu optimieren.
Weitere Themen
- Datenbank-Fehler und ihre Auswirkungen
- Tücken der Prozentrechnung
- Was ist ein Webserver?
- Was ist Clustering und wozu dient es?
- Was versteht man unter «Content Writing»
- Stars und Hunde
Zur Erinnerung: wir beraten Sie in Sachen
- Google Analytics 4: Am 1. Juli 2023 wurde das bekannte Universal Analytics durch Google Analytics 4 ersetzt. Nun ist es wichtig, mitzugehen, um im Web Analytics keine Daten zu verlieren.
- Digitale Automatisierung: Viele Prozesse lassen sich digitalisieren und automatisieren, was in der Regel zu Kosteneinsparungen führt.
- Datengetriebenes Business: Auffinden von Potenzialen in Ihren bisher ungenutzten Daten
- Flexible Arbeit: Home Office, Coworking, virtuelles Büro, digitaler Nomadismus
- Coaching: Heranführen von Kader und Mitarbeitern an zeitgemässe Arbeitsformen: agile, kundenorientierte Produktentwicklung, Social Media, Coworking, Online-Teamarbeit