In der Google-Suche können nur Seiten als Ergebnis auftauchen, die Google bekannt sind und gecrawlt sowie indexiert wurden. Detaillierte Informationen über den Crawling-Prozess gibt im verlinkten Artikel.
Das sogenannte Crawling ist ein ressourcenintensiver Prozess und lange Zeit gab es keinen offiziellen Weg, um Suchmaschinen umgehend über eine Veröffentlichung oder Aktualisierung einer neuen Seite zu informieren. Die Folge: Es konnte mehrere Tage oder Wochen dauern, bis eine Seite erstmalig oder erneut von Google indexiert wurde.
Das hat sich im Juni 2018 mit der Google Indexing API geändert – wenngleich diese (offiziell) nur Seiten vom Typ JobPosting und BroadcastEvent unterstützt. Dass die Nutzung nicht auf diese Seitentypen beschränkt ist, ist die Grundlage des getIndexed. Das Tool nutzt die Google Indexing API und ermöglicht dadurch die schnelle erstmalige oder erneute Indexierung von Webseiten.
Inhaltsverzeichnis
Welchen Vorteil bietet die Google Indexing API?
Aktuell ist die Google Indexing API die einzige Möglichkeit, um ein quasi sofortiges Crawling einer Adresse zu forcieren. Google erlaubt pro Tag und Website die Einreichung von bis zu 200 Adressen.
Der Hintergrund: Google muss das eigene Crawling priorisieren. Deshalb kann zwischen zwei Besuchen derselben Seite mehrere Tage oder gar Wochen liegen. Besonders bereits indexierte Seiten mit einer historisch niedrigen Aktualisierungsfrequenz werden sehr langsam erneut gecrawlt.
Um einen „Re-Crawl“ zu forcieren, gibt es abseits der Indexing API diese Möglichkeiten:
- Neue Verlinkungen zur Seite setzen
- lastmod-Datum in der XML-Sitemap anpassen
- Seite per Google Search Console „URL Inspection“-Funktion einreichen
Der Hasenfuß: Die XML-Sitemap wird zwar regelmäßig, aber nicht stündlich gecrawlt. Auch bis neue Links verarbeitet wurden, kann es dauern. Deshalb bleibt eigentlich nur die Google Search Console zur Neu-Indexierung von Seiten.
Reicht nicht die URL-Inspection in der Google Search Console?
Die URL-Inspection, auf Deutsch URL-Prüfung, in der Google Search Console erlaubt es, mehr Informationen über eine einzelne Seite aus dem Google Index zu erhalten. In der URL-Prüfung ist zudem ein „Indexierung beantragen“ möglich. Reicht das nicht aus?
Nein, denn die URL-Überprüfung hat im Gegensatz zur Indexing API folgende Nachteile:
- Die URL wird nur einer bevorzugten Crawling-Warteschlange hinzugefügt. Ein quasi umgehender Besuch und eine (Neu-)Indexierung ist nicht garantiert.
- Die URL Inspection kann immer nur für einzelne Adressen genutzt werden.
Wie kannst du die Google Indexing API nutzen?
Natürlich ist getIndexed nicht die einzige Möglichkeit, um auf die Indexing API von Google zuzugreifen.
Option 1: Der API Explorer
Google selbst bietet den Google API Explorer unter diesem Link an. Sollte der Explorer nicht aufgehen, dann klicke in der Sidebar auf „Testen“.
Gib dort deine vollständige Adresse ein. Nachdem du per OAuth-Dialog den Zugriff auf die Google Search Console der angegebenen Adresse erteilt hast, wird die Abfrage abgeschickt. Du solltest, wie im Screenshot zu sehen, eine Erfolgsmeldung erhalten.
Der Nachteil ist, dass du immer nur einzelne Adressen einreichen kannst.
Option 2: Fast Indexing API Plugin für WordPress
Für das beliebt CMS WordPress gibt es ein Plugin, das die Indexing API anbindet: Fast Indexing API. Das Plugin erlaubt es, mehrere Adressen auf einmal einzureichen – allerdings ist es auf WordPress beschränkt. Nutzer von anderen CMS können das Plugin nicht nutzen.