Die Grundlagen der Funktionsweise der Suchmaschinenindizierung

Veröffentlicht: 2022-04-17

Suchmaschinenoptimierung (SEO) ist eine wesentliche Methode, um die Sichtbarkeit Ihrer Website zu steigern und mehr organischen Traffic anzuziehen. Es ist jedoch eine komplexe Strategie, die auf dem Verständnis von Algorithmen und der Nutzung einer Vielzahl von Ranking-Faktoren beruht. Wenn Sie ein SEO-Experte werden möchten, müssen Sie die Indizierung von Suchmaschinen verstehen.

In diesem Beitrag erklären wir, wie Suchmaschinen Websites indizieren und wie Sie Ihr Ranking verbessern können. Außerdem beantworten wir einige häufig gestellte Fragen zu diesem SEO-Konzept. Lass uns anfangen!

Was ist Suchmaschinenindizierung?

Die Suchmaschinenindizierung bezieht sich auf den Prozess, bei dem eine Suchmaschine (wie Google) Online-Inhalte organisiert und in einer zentralen Datenbank (ihrem Index) speichert. Die Suchmaschine kann dann den Inhalt analysieren und verstehen und ihn den Lesern in Ranglisten auf ihren Suchmaschinen-Ergebnisseiten (SERPs) bereitstellen.

Vor der Indexierung einer Website untersucht eine Suchmaschine mithilfe von „Crawlern“ Links und Inhalte. Dann nimmt die Suchmaschine den gecrawlten Inhalt und organisiert ihn in ihrer Datenbank:

Suchmaschinenindizierung erklärt.

Bildquelle: Seobility – Lizenz: CC BY-SA 4.0

Wie dieser Prozess funktioniert, sehen wir uns im nächsten Abschnitt genauer an. Im Moment kann es hilfreich sein, sich die Indexierung als Online-Ablagesystem für Website-Beiträge und -Seiten, Videos, Bilder und andere Inhalte vorzustellen. Wenn es um Google geht, ist dieses System eine riesige Datenbank, die als Google-Index bekannt ist.

Wie indiziert eine Suchmaschine eine Website?

Suchmaschinen wie Google verwenden „Crawler“, um Online-Inhalte zu durchsuchen und zu kategorisieren. Diese Crawler sind Software-Bots, die Links folgen, Webseiten scannen und so viele Daten wie möglich über eine Website sammeln. Dann liefern sie die Informationen zur Indizierung an die Server der Suchmaschine:

Suchmaschinen-Crawler

Bildquelle: Seobility – Lizenz: CC BY-SA 4.0

Jedes Mal, wenn Inhalte veröffentlicht oder aktualisiert werden, werden sie von Suchmaschinen gecrawlt und indiziert, um ihre Informationen zu ihren Datenbanken hinzuzufügen. Dieser Vorgang kann automatisch erfolgen, aber Sie können ihn beschleunigen, indem Sie Sitemaps an Suchmaschinen übermitteln. Diese Dokumente beschreiben die Infrastruktur Ihrer Website, einschließlich Links, damit Suchmaschinen Ihre Inhalte effektiver durchsuchen und verstehen können.

Suchmaschinen-Crawler arbeiten mit einem „Crawl-Budget“. Dieses Budget begrenzt, wie viele Seiten die Bots innerhalb eines festgelegten Zeitraums auf Ihrer Website crawlen und indizieren. (Sie kommen jedoch zurück.)

Crawler stellen Informationen zu wesentlichen Daten wie Schlüsselwörtern, Veröffentlichungsdaten, Bildern und Videodateien zusammen. Suchmaschinen analysieren auch die Beziehung zwischen verschiedenen Seiten und Websites, indem sie internen Links und externen URLs folgen und diese indexieren.

Beachten Sie, dass Suchmaschinen-Crawler nicht allen URLs auf einer Website folgen. Sie werden DoFollow-Links automatisch crawlen und ihre NoFollow-Äquivalente ignorieren. Daher sollten Sie sich bei Ihren Linkaufbau-Bemühungen auf DoFollow-Links konzentrieren. Dies sind URLs von externen Websites, die auf Ihre Inhalte verweisen.

Wenn externe Links aus qualitativ hochwertigen Quellen stammen, geben sie ihren „Linkjuice“ weiter, wenn Crawler ihnen von einer anderen Site zu Ihrer folgen. Daher können diese URLs Ihre Platzierungen in den SERPs verbessern:

Link-Saft

Bildquelle: Seobility – Lizenz: CC BY-SA 4.0

Beachten Sie außerdem, dass einige Inhalte nicht von Suchmaschinen gecrawlt werden können. Wenn Ihre Seiten hinter Anmeldeformularen oder Passwörtern verborgen sind oder Sie Text in Ihre Bilder eingebettet haben, können Suchmaschinen nicht auf diese Inhalte zugreifen und diese indizieren. (Sie können Alt-Text verwenden, um diese Bilder jedoch eigenständig in Suchen erscheinen zu lassen.)

4 Tools für die Suchmaschinenindizierung

Sie können verschiedene Tools verwenden, um zu steuern, wie Google und andere Suchmaschinen Ihre Inhalte crawlen und indizieren. Sehen wir uns einige der hilfreichsten Optionen an!

1. Sitemaps

Denken Sie daran, dass es zwei Arten von Sitemaps gibt: XML und HTML. Es kann leicht sein, diese beiden Konzepte zu verwechseln, da sie beide Arten von Sitemaps sind, die auf -ML enden , aber sie dienen unterschiedlichen Zwecken.

HTML-Sitemaps sind benutzerfreundliche Dateien, die den gesamten Inhalt Ihrer Website auflisten. Beispielsweise finden Sie normalerweise eine dieser Sitemaps in der Fußzeile einer Website. Scrollen Sie auf Apple.com ganz nach unten, und Sie werden dies finden, eine HTML-Sitemap:

Ein Beispiel für eine HTML-Sitemap auf der Apple-Website

Diese Sitemap ermöglicht Besuchern eine einfache Navigation auf Ihrer Website. Es fungiert als allgemeines Verzeichnis und kann Ihre SEO positiv beeinflussen und eine solide Benutzererfahrung (UX) bieten.

Im Gegensatz dazu enthält eine XML-Sitemap eine Liste aller wesentlichen Seiten Ihrer Website. Sie übermitteln dieses Dokument an Suchmaschinen, damit diese Ihre Inhalte effektiver crawlen und indexieren können:

Ein Beispiel für eine XML-Sitemap

Denken Sie daran, dass wir uns auf XML-Dokumente beziehen, wenn wir in diesem Artikel über Sitemaps sprechen. Wir empfehlen auch, unseren Leitfaden zum Erstellen einer XML-Sitemap zu lesen, damit Sie das Dokument für verschiedene Suchmaschinen bereit haben.

2. Google-Suchkonsole

Wenn Sie Ihre SEO-Bemühungen auf Google konzentrieren möchten, ist die Google Search Console ein unverzichtbares Tool, das Sie beherrschen müssen:

Google Search Console.

In der Konsole können Sie auf einen Bericht zur Indexabdeckung zugreifen, der Ihnen mitteilt, welche Seiten von Google indiziert wurden, und alle Probleme während des Vorgangs hervorhebt. Hier können Sie problematische URLs analysieren und Fehler beheben, um sie „indexierbar“ zu machen.

Zusätzlich können Sie Ihre XML-Sitemap an die Google Search Console übermitteln. Dieses Dokument fungiert als „Fahrplan“ und hilft Google dabei, Ihre Inhalte effektiver zu indizieren. Darüber hinaus können Sie Google bitten, bestimmte URLs und Teile Ihrer Website erneut zu crawlen, sodass aktualisierte Themen für Ihr Publikum immer verfügbar sind, ohne darauf warten zu müssen, dass die Crawler von Google zu Ihrer Website zurückkehren.

3. Alternative Suchmaschinenkonsolen

Obwohl Google die beliebteste Suchmaschine ist, ist es nicht die einzige Option. Wenn Sie sich auf Google beschränken, kann Ihre Website für Zugriffe von alternativen Quellen wie Bing gesperrt werden:

Bin

Wir empfehlen, unsere Leitfäden zur Übermittlung von XML-Sitemaps an Bing Webmaster Tools und Yandex Webmaster Tools zu lesen. Leider ermöglichen Ihnen andere Suchmaschinen, einschließlich Yahoo und DuckDuckGo, nicht, Sitemaps einzureichen.

Denken Sie daran, dass jede dieser Konsolen einzigartige Tools zur Überwachung der Indizierung und Platzierung Ihrer Website in den SERPs bietet. Daher empfehlen wir, sie auszuprobieren, wenn Sie Ihre SEO-Strategie erweitern möchten.

4. Robots.txt

Wir haben bereits behandelt, wie Sie eine Sitemap verwenden können, um Suchmaschinen anzuweisen, bestimmte Seiten auf Ihrer Website zu indizieren. Darüber hinaus können Sie bestimmte Inhalte ausschließen, indem Sie eine robots.txt -Datei verwenden.

Eine robots.txt -Datei enthält Indexierungsinformationen zu Ihrer Website. Es wird in Ihrem Stammverzeichnis gespeichert und besteht aus zwei Zeilen: einer User-Agent- Zeile, die einen Suchmaschinen-Crawler angibt, und einer Disallow -Anweisung, die bestimmte Dateien blockiert.

Eine robots.txt -Datei könnte beispielsweise so aussehen:

 User-Agent: *
Nicht zulassen: /Beispielseite/
Nicht zulassen: /Beispielseite_2/

In diesem Beispiel deckt das * alle Suchmaschinen-Crawler ab. Dann geben die Disallow- Zeilen bestimmte Dateien oder URL-Pfade an.

Sie müssen lediglich eine einfache Textdatei erstellen und sie robots.txt nennen. Fügen Sie dann Ihre Disallow -Daten hinzu und laden Sie die Datei mit einem File Transfer Protocol (FTP)-Client in Ihr Stammverzeichnis hoch.

Häufig gestellte Fragen

Bisher haben wir die Grundlagen der Suchmaschinenindizierung behandelt. Wenn Sie noch Fragen zu diesem SEO-Konzept haben, beantworten wir diese hier! (Und wenn du noch einen hast, lass es uns in den Kommentaren wissen, damit wir ihn dort beantworten können!)

Wie kann ich von Suchmaschinen besser indexiert werden?

Sie können von Suchmaschinen besser indiziert werden, indem Sie Sitemaps erstellen, sie auf Crawling-Fehler prüfen und sie an mehrere Suchmaschinen übermitteln. Darüber hinaus sollten Sie erwägen, Ihre Inhalte für Mobilgeräte zu optimieren und Ihre Ladezeiten zu verkürzen, um das Crawling und die Indexierung zu beschleunigen.

Die häufige Aktualisierung Ihrer Inhalte kann auch Suchmaschinen darauf aufmerksam machen, Ihre „neuen“ Seiten zu crawlen und zu indizieren. Abschließend empfehlen wir, Suchmaschinen daran zu hindern, doppelte Inhalte zu crawlen, indem Sie eine robots.txt -Datei verwenden oder löschen.

Muss ich Suchmaschinen anweisen, meine Website zu crawlen?

Suchmaschinen crawlen neue öffentlich zugängliche Inhalte im Internet, aber dieser Vorgang kann Wochen oder Monate dauern. Daher ziehen Sie es vielleicht vor, die Dinge zu beschleunigen, indem Sie eine Sitemap bei den Suchmaschinen Ihrer Wahl einreichen.

Muss ich Suchmaschinen benachrichtigen, wenn ich neue Inhalte veröffentliche?

Wir empfehlen, Ihre Sitemap zu aktualisieren, wenn Sie neue Inhalte veröffentlichen. Dieser Ansatz stellt sicher, dass Ihre Posts schneller gecrawlt und indexiert werden. Wir empfehlen die Verwendung eines Plugins wie Yoast SEO, um Sitemaps einfach zu erstellen.

Werden meine Inhalte jemals von Google oder anderen Suchmaschinen entfernt?

Google kann einen Beitrag oder eine Seite aus seinem Index entfernen, wenn der Inhalt gegen seine Nutzungsbedingungen verstößt. Dies bedeutet, dass der Inhalt in vielen Fällen gegen Datenschutz, Verleumdung, Urheberrecht oder andere Gesetze verstößt. Google entfernt auch personenbezogene Daten aus seinem Index, wie z. B. identifizierbare finanzielle oder medizinische Informationen. Schließlich kann Google Seiten bestrafen, die Black-Hat-SEO-Techniken verwenden.

Wie kann ich meine Inhalte neu indizieren lassen, wenn sie entfernt wurden?

Sie können Google bitten, Ihre Inhalte neu zu indizieren, indem Sie sie so ändern, dass sie den Qualitätsrichtlinien für Webmaster der Suchmaschine entsprechen. Dann können Sie einen Antrag auf erneute Überprüfung stellen und auf die Antwort von Google warten.

Wie kann ich verhindern, dass Suchmaschinen bestimmte Seiten indizieren?

Sie können verhindern, dass Suchmaschinen bestimmte Seiten indizieren, indem Sie dem <head> -Abschnitt der Seite ein noindex -Metatag hinzufügen. Wenn Ihr Inhalt eine Mediendatei ist, können Sie ihn alternativ zu einer robots.txt -Datei hinzufügen. Schließlich können Sie mit den Google Webmaster-Tools eine Seite mit dem Tool zum Entfernen von URLs ausblenden.

Fazit

SEO ist ein weites Feld, das alles von Suchmaschinenalgorithmen bis hin zu Offpage-Optimierungstechniken abdeckt. Wenn Sie neu in diesem Thema sind, fühlen Sie sich vielleicht von all den Informationen überwältigt. Glücklicherweise ist die Indizierung eines der am einfachsten zu verstehenden Konzepte.

Die Suchmaschinenindizierung ist ein wesentlicher Prozess, der den Inhalt Ihrer Website in einer zentralen Datenbank organisiert. Suchmaschinen-Crawler analysieren den Inhalt und die Architektur Ihrer Website, um sie zu kategorisieren. Dann können sie Ihre Seiten auf ihren Ergebnisseiten für bestimmte Suchbegriffe einstufen.

Haben Sie weitere Fragen zur Suchmaschinenindexierung? Lassen Sie es uns im Kommentarbereich unten wissen!

Vorgestelltes Bild über Sammby/shutterstock.com