Zurück zu allen Beiträgen
guides 7 min read

Bots sind jetzt über die Hälfte des Webs: Was das bedeutet

Serap Gündoğdu ·
Bots sind jetzt über die Hälfte des Webs: Was das bedeutet

Die Schlagzeile, die diesen Monat die Runde macht, lautet, dass Bots inzwischen mehr als die Hälfte des gesamten Web Traffics ausmachen. Das stimmt, es klingt beunruhigend, und die meisten Schlüsse, die daran hängen, sind die falsche Art von beunruhigend. Die Zahl ist echt, aber die Folgerung, die die Leute daraus ziehen, ist es meistens nicht.

Lassen Sie mich also auspacken, was die Daten tatsächlich sagen, den Teil, der Ihr Verhalten ändern sollte, von dem trennen, der es nicht sollte, und ehrlich sein, wo das einen ganz normalen Websitebetreiber zurücklässt. Die Kurzfassung: dass die Bots die Fünfzig Prozent Marke überschreiten, ist ein Meilenstein, kein Notfall. Was zählt, ist, welche Bots Sie treffen und was sie mit Ihrem Crawl Budget anstellen, und das ist eine Frage, die Sie an einem Nachmittag beantworten können, statt sich abstrakt darüber zu sorgen.

Was die Zahlen wirklich sagen

Branchenberichte zeichnen dasselbe Bild. Über mehrere Messungen des gesamten Internet Traffics hinweg haben automatisierte Anfragen den Traffic von echten Menschen knapp überholt, irgendwo etwas über der Hälfte. Diese Zahl steigt seit Jahren, deshalb überrascht weniger, dass es passiert ist, als vielmehr, dass es so lange gedauert hat, die Linie zu überschreiten.

Das entscheidende Detail steckt unter der Schlagzeile. “Bot Traffic” ist nicht eine einzige Sache. Er teilt sich grob in drei Töpfe auf, und unterschiedlicher könnten sie kaum sein:

  • Gute Bots mit einer Aufgabe. Suchmaschinen Crawler, Uptime Monitore, Feed Reader und die neueren KI Crawler, die Seiten für das Training oder zum Beantworten von Fragen abrufen. Diese geben sich zu erkennen und halten sich meistens an die Regeln.
  • Schlechte Bots. Scraper, die Inhalte stehlen, Credential Stuffer, Lagerbestand Hamsterer, Schwachstellen Scanner. Diese lügen über ihre Identität und ignorieren Ihre Regeln mit Absicht.
  • KI Crawler, das neue und schnell wachsende Segment. GPTBot, ClaudeBot, Google-Extended, PerplexityBot und andere. Technisch sind sie gute Bots, aber ihr Volumen ist so schnell gewachsen, dass sie eine eigene Zeile verdienen.

Wenn jemand sagt, Bots seien die Hälfte des Webs, dann addiert er alle drei zusammen. Diese kombinierte Zahl als eine einzige Bedrohung zu behandeln, ist der erste Fehler, denn Ihre Reaktion auf einen Content Scraper und Ihre Reaktion auf den Googlebot sollten genau entgegengesetzt sein.

Ein Balken, der in drei farbige Segmente mit den Bezeichnungen gute Bots, schlechte Bots und KI Crawler unterteilt ist, daneben ein kleinerer Balken für menschlichen Traffic

Warum das KI Segment so schnell wächst

Das Wachstum verteilt sich nicht gleichmäßig. Klassisches Suchmaschinen Crawling ist relativ stabil. Den größten Zuwachs an neuen Anfragen bringt die KI: Modelle, die trainiert werden, und zunehmend Modelle, die im Moment der Frage eines Nutzers Live Seiten abrufen, um zu antworten.

Das ist eine echte Verschiebung, nicht einfach mehr vom Gleichen. Ein klassischer Suchmaschinen Crawler besucht, indexiert einmal und schickt Ihnen über die folgenden Wochen Besucher. Ein Live KI Abruf zieht vielleicht Ihre Seite, nutzt sie, um eine Antwort zu formulieren, und schickt Ihnen nichts, weil der Nutzer schon innerhalb des Chats bekommen hat, was er brauchte. Ob diese Engines die Dateien, die Sie für sie einrichten, überhaupt lesen, haben wir uns in unserem Beitrag dazu angesehen, ob KI Engines llms.txt wirklich lesen, und die Antwort war ernüchternd. Die Protokolle, die gebaut werden, um diesen Austausch fairer zu machen, etwa NLWeb und AIPREF, stecken noch in den Anfängen, was wir im Erklärer zu den agentischen Web Standards behandelt haben.

Praktisch läuft es darauf hinaus, dass ein größerer Teil der Arbeit Ihres Servers nun für ein Publikum erledigt wird, das vielleicht nie durchklickt. Das ist unangenehm, aber es ist eine Strategiefrage für einen anderen Tag. Die unmittelbare, konkrete Kostenstelle ist einfacher: jeder dieser Abrufe verbraucht einen Teil Ihres Crawl Budgets.

Der Teil, der Sie wirklich betrifft: Das Crawl Budget

Hier hört die Hälfte des Webs Zahl auf, bloße Kuriosität zu sein, und wird zu Ihrem Problem. Ihre Website hat eine begrenzte Menge an Aufmerksamkeit, die ein Crawler in einem gegebenen Zeitfenster für sie aufbringt. Wenn das Bot Volumen steigt, konkurrieren mehr Anfragen um dasselbe Budget, und die Anfragen, die sich durchsetzen, sind nicht immer die Seiten, die Ihnen wichtig sind.

Wenn ein Crawler seinen Besuch für Facetten Filter URLs, abgelaufene Tag Seiten, Session ID Duplikate und dünne Archivseiten verbraucht, bleibt weniger für die Seiten übrig, die Ihnen Traffic bringen. Über genau dieses Versagen haben wir in warum Seiten ohne Mehrwert häufiger gecrawlt werden geschrieben, und der Anstieg des gesamten Bot Traffics macht das Symptom schärfer, nicht anders. Eine unaufgeräumte Website hat schon vorher Crawl Budget verschwendet, jetzt verschwendet sie mehr davon, und das schneller.

Die gute Nachricht ist, dass sich die Hebel nicht geändert haben. Steigender Bot Traffic ist ein Grund, sie endlich zu ziehen, kein Grund zur Panik:

  • Hören Sie auf, Crawler mit Müll zu füttern. Kürzen Sie die wertlosen, fast doppelten und parametererzeugten URLs, die nur existieren, um gecrawlt zu werden. Der Leitfaden zur Crawl Budget Optimierung geht den gesamten Prozess durch.
  • Lenken Sie Aufmerksamkeit über Struktur. Interne Links sind das stärkste Signal, das Sie dafür kontrollieren, wo Crawler ihre Zeit verbringen. Das behandeln wir in internen Links als Werkzeug für das Crawl Budget.
  • Setzen Sie klare Regeln für KI Bots. Entscheiden Sie bewusst, welche KI Crawler worauf zugreifen dürfen, und schreiben Sie es ordentlich auf. Die Komplettanleitung zu robots.txt und KI Bots behandelt die Syntax und die Abwägungen.

Wie Sie herausfinden, was Ihre Seite tatsächlich trifft

Die ehrliche Antwort auf “sind Bots ein Problem für mich” lautet: Sie wissen es nicht, bis Sie nachsehen, und fast niemand sieht nach. Die aggregierte Hälfte des Webs Zahl sagt Ihnen nichts über Ihre konkrete Website. Ihr Mix könnte zu neunzig Prozent aus dem Googlebot bestehen, der nützliche Arbeit leistet, oder es könnte ein Scraper sein, der einen einzigen Endpunkt malträtiert und Ihre Antwortzeiten in die Knie zwingt.

Zwei Dinge sagen Ihnen die Wahrheit. Erstens Ihre Server Logs. Sie zeichnen jede Anfrage auf, den echten User Agent, die IP, den Statuscode und welche URLs am häufigsten getroffen wurden. Eine Log Stichprobe über ein paar Tage zeigt Ihnen sofort, ob Ihr Crawl Budget für die Geld Seiten ausgegeben wird oder für einen Sumpf aus Parameter URLs. Bedenken Sie, dass User Agents gefälscht werden können, gleichen Sie die größten Verursacher also mit den veröffentlichten IP Bereichen ab, die echte Such und KI Crawler dokumentieren.

Zweitens crawlen Sie Ihre eigene Website so, wie es ein Bot tun würde. Wenn Sie einen Crawler über Ihre Seite laufen lassen, sehen Sie dieselbe Struktur, die ein Such oder KI Bot sieht: wie viele URLs Sie tatsächlich offenlegen, wie viele dünn oder doppelt sind, wo Weiterleitungsketten und verwaiste Seiten still und leise Budget fressen. Genau dafür ist unser eigener Crawler gebaut, und er funktioniert unter Windows, macOS und Linux gleich, passt also zu dem, was Sie ohnehin schon nutzen. Sie raten nicht mehr an der aggregierten Zahl herum, Sie schauen sich Ihre eigene an.

Eine Lupe über einer Sitemap, einige Seiten als verschwendete Crawl Pfade hervorgehoben, die Hauptseiten klar erkennbar

Das Fazit

Dass Bots die Hälfte des gesamten Web Traffics überschreiten, ist ein echter Meilenstein und ein nützlicher Anlass, aber für sich genommen kein Grund zur Furcht. Die Zahl wirft hilfreiche Crawler, schädliche Scraper und ein schnell wachsendes KI Segment in einen Topf, die jeweils eine andere Antwort verlangen. Sie zu einer einzigen erschreckenden Statistik zu mitteln, ist der Weg, am Ende entweder ein echtes Scraper Problem zu übersehen oder die Crawler zu blockieren, die Ihnen tatsächlich Traffic schicken.

Der Schritt, der sich auszahlt, ist unspektakulär und liegt vollständig in Ihrer Hand: schauen Sie sich Ihre eigenen Logs an, crawlen Sie Ihre eigene Website und geben Sie Ihr Crawl Budget für die Seiten aus, die zählen. Dass das Web mit Bots voller wird, steigert nur den Wert einer Website, die sauber und leicht zu crawlen ist. Dieser Teil hat sich nicht geändert, und es ist immer noch die Arbeit, die sich lohnt.