Agentic Web Standards: NLWeb, MCP und AIPREF verständlich erklärt

Inzwischen gibt es fast jeden Monat ein neues Kürzel. NLWeb, MCP, A2A, AIPREF, llms.txt. Jedes kommt mit einem Blogbeitrag, der Ihnen erklärt, dass Ihre Website bald überflüssig ist, wenn Sie es nicht sofort einführen. Wer eine Website betreibt und versucht, Schritt zu halten, schwankt ehrlich gesagt zwischen Neugier und Erschöpfung.
Also mache ich das Unspektakuläre und erkläre, was diese Standards wirklich sind, welches Problem sie lösen sollen und was ein Websitebetreiber jetzt tatsächlich damit tun sollte. Manches ist wichtig. Das meiste sollten Sie verstehen, aber nicht diese Woche umsetzen.
Zur Einordnung sind bereits zwei Verschiebungen passiert. Zuerst kam die Frage, ob eine KI Ihre Seite liest und zitiert, das Feld der Generative Engine Optimization. Dann kamen Agenten, die Ihre Website im Auftrag eines Nutzers bedienen, was wir in Agentic SEO und das Universal Commerce Protocol durchgegangen sind. Dieser Artikel handelt von einer dritten Ebene darunter: den Protokollen, die gebaut werden, damit Agenten und Websites auf eine standardisierte Weise miteinander sprechen können.
Was das agentische Web wirklich bedeutet
“Agentisches Web” ist ein loser Begriff, deshalb hilft Präzision. Es bedeutet nicht nur, dass eine KI Ihre Schaltflächen anklickt. Dieser Teil, ein Agent, der einen Browser durch Ihren Bestellvorgang steuert, ist das Thema des früheren Agentic SEO Leitfadens.
Die neuere Idee ist eine Ebene aus Standards, die es einer Website erlaubt, einem Agenten einen sauberen, strukturierten Weg zu bieten, Fragen zu stellen und Aktionen auszuführen, ganz ohne die gerenderte Seite zu scrapen. Stellen Sie sich den Unterschied vor zwischen jemandem, der eine Speisekarte von einer Kreidetafel abliest, und einem Restaurant, das ihm eine strukturierte Liste mit Preisen, Allergenen und Verfügbarkeit fertig sortiert in die Hand drückt. Dieselbe Information, aber die eine lässt sich viel leichter und günstiger verarbeiten.
Drei Standards bestimmen in diesem Bereich die Diskussion. NLWeb, mit dem eine Website Fragen in natürlicher Sprache beantwortet. MCP, mit dem eine Website Werkzeuge bereitstellt, die ein Agent aufrufen kann. Und AIPREF, mit dem eine Website festlegt, wie ihre Inhalte von KI genutzt werden dürfen. Sie überschneiden sich, sie sind sehr unterschiedlich ausgereift, und nur einer von ihnen ist eine fertige Idee, die Sie vernünftigerweise einsetzen könnten.

NLWeb: Ihre Website als Gespräch
NLWeb ist ein offenes Projekt, das Microsoft auf seiner Build 2025 Konferenz vorgestellt hat. Interessant ist, wer dahintersteht: R.V. Guha, die Person, die mit RSS, RDF und Schema.org verbunden ist. Diese Herkunft ist wichtig, denn NLWeb stützt sich auf Formate, die Sie bereits kennen, statt ein neues Universum zu erfinden.
Die Mechanik ist leicht zu beschreiben. Eine Website mit NLWeb stellt einen /ask Endpunkt bereit. Ein Agent, oder auch ein Mensch, sendet eine Frage in natürlicher Sprache daran, und die Website liefert eine strukturierte JSON Antwort zurück, die in den eigenen Inhalten der Website verankert ist. Im Hintergrund nutzt NLWeb erneut Schema.org Auszeichnung, RSS, Sitemaps und Feeds und kombiniert sie mit einem Sprachmodell und einem Vektorindex, damit die Antworten an Ihre echten Daten gebunden bleiben und nicht erfunden werden.
Ein Detail ist noch wichtig. Jede NLWeb Instanz ist zugleich ein MCP Server, was uns zum nächsten Standard bringt.
MCP: Ein universeller Anschluss für Agenten
MCP, das Model Context Protocol, wurde Ende 2024 von Anthropic eingeführt. Die übliche Analogie ist ein universeller Stecker. Vor einem gemeinsamen Standard war jede KI Integration eine individuelle Verdrahtung. MCP gibt Agenten einen standardisierten Weg, die Werkzeuge zu entdecken und zu nutzen, die ein Dienst anbietet.
Für eine Website ist ein MCP Server etwas, das der Betreiber selbst einrichtet und hostet, in der Regel einen pro Website. Er definiert eine Reihe von Werkzeug Endpunkten, etwa getProductDetails oder createAppointment, beschrieben mit einem maschinenlesbaren Schema. Ein Agent, der MCP spricht, kann diese Werkzeuge dann entdecken und auf vorhersehbare Weise aufrufen, statt zu raten, wie Ihre Seite funktioniert.
Es ist verlockend, MCP als eine schlauere robots.txt zu bezeichnen, und das trifft einen Teil, aber der Vergleich greift zu kurz. Eine robots.txt sagt einem Bot, wohin er nicht gehen darf. Ein MCP Server sagt einem Agenten, was er tatsächlich tun kann, und reicht ihm saubere, segmentierte Daten dafür. Für manche Unternehmen ist das eine echte Chance, etwa für Verlage, die einen strukturierten Datensatz bereitstellen und den Zugang dazu bepreisen könnten. Für die meisten kleinen Websites ist es Infrastruktur, die sie noch nicht brauchen.
AIPREF: Festlegen, wie KI Ihre Inhalte nutzen darf
Der dritte Standard ist der bodenständigste der drei, denn er löst ein Problem, das jeder Websitebetreiber bereits hat: eine Möglichkeit zu sagen “du darfst dies lesen, aber nicht damit trainieren”, und das von Maschinen respektieren zu lassen.
AIPREF ist eine Arbeitsgruppe der IETF, demselben Standardisierungsgremium, das zentrale Internetprotokolle definiert. Sie baut ein kleines, gemeinsames Vokabular, um Präferenzen zur KI Nutzung auszudrücken. Der aktuelle Entwurf definiert zwei Nutzungskategorien. train-ai umfasst die Verwendung Ihrer Inhalte zum Aufbau oder zur Verfeinerung eines KI Modells. search umfasst Anwendungen, deren Hauptzweck es ist, Ihre Inhalte zu finden und Nutzer mit Quellenangabe zu Ihnen zurückzuführen. Jede Kategorie kann auf erlauben, verbieten oder unausgesprochen gesetzt werden.
Die Gruppe arbeitet auch daran, wie Sie diese Präferenzen an Inhalte anhängen, entweder im Inhalt selbst eingebettet oder über eine Datei im Geiste der robots.txt, dazu Regeln, um widersprüchliche Signale aufzulösen. Das hängt direkt damit zusammen, wie Sie den Zugriff von Crawlern ohnehin schon steuern.
Hier der ehrliche Stand. AIPREF ist auf dem Standardisierungspfad, aber noch nicht fertig. Der Entwurf des Vokabulars wird noch überarbeitet, und die aktuelle Revision soll Ende 2026 ablaufen. Das ist für IETF Arbeit normal, und genau deshalb sollten Sie Ihre Zugriffsrichtlinie in diesem Quartal nicht darum herum neu bauen. Verstehen Sie es, beobachten Sie es, und halten Sie Ihre bestehenden Robots und Bot Regeln in der Zwischenzeit sauber.
Was Sie heute tatsächlich tun sollten
Hier ist der Teil, den die meisten Artikel überspringen. Optimierung für das agentische Web wird oft als ein Stapel von Ebenen dargestellt, und die nützliche Erkenntnis ist, dass jede Ebene auf der darunter liegenden ruht. Semrush stellt es ungefähr so dar, und die Reihenfolge ist entscheidend:

- SEO Grundlagen. Ihre Website muss crawlbar und frei von technischen Mängeln sein. Wenn ein normaler Crawler über Ihre Seite stolpert, tut es ein Agent auch.
- Agentenbereitschaft. Klare Sprache, semantische Struktur, vollständige Daten, damit eine Maschine versteht, was Ihre Marke ist und was Sie anbieten, ohne zu raten.
- Präsenz außerhalb der eigenen Seite. Einheitliche Informationen über Ihre Marke im ganzen Web, damit ein Agent sich aus mehr als einer Quelle ein richtiges Bild von Ihnen macht.
- Aktionsebene. Dass die Seite für einen Agenten wirklich bedienbar ist, das Formular, das absendet, die Schaltfläche, die funktioniert.
Beachten Sie, was auf dieser Liste steht und was nicht. NLWeb Endpunkte und MCP Server sitzen ganz oben, und sie zahlen sich erst aus, wenn alles darunter solide ist. Der größte Teil des Werts für eine typische Website liegt in den unteren beiden Ebenen, und diese kontrollieren Sie heute, ganz ohne neues Protokoll.
Konkret ist die Arbeit, die sich auszahlt, egal welcher Standard sich durchsetzt, dieselbe unspektakuläre Liste wie immer. Sauberes, crawlbares HTML ohne defekte Links oder Weiterleitungsketten. Keine versehentlichen noindex oder gesperrten Seiten. Vollständige Schema.org Auszeichnung auf Ihren wichtigen Seiten statt dünner Auszeichnung überall, denn unvollständige strukturierte Daten signalisieren einem Agenten Unsicherheit, genauso wie einer Suchmaschine. Korrekte Feeds und Sitemaps. Ehrliche, aktuelle Produkt und Servicedaten. Genau diese Daten sind auch die Grundlage, aus der NLWeb selbst liest, und das ist der Punkt: Machen Sie die Basis gut, und Sie sind schon fast bereit für Agenten.
Schema Auszeichnung verdient einen eigenen Hinweis, denn sie wird still und leise Teil der Infrastruktur des agentischen Webs. Agenten nutzen sie nicht nur, um zu erkennen, was eine Entität ist, sondern auch, um Beziehungen, Relevanz und die Frage zu beurteilen, ob Ihr Inhalt vertrauenswürdig genug ist, um danach zu handeln. Vollständig ausgefüllte Auszeichnung auf Ihren Schlüsselseiten schlägt dünne, breit gestreute Auszeichnung.
Der Hype Filter
Jetzt der unbequeme Teil, denn das agentische Web hat einige wirklich alberne Behauptungen angezogen. Sie werden lesen, Ihre Website sei bereits überflüssig, menschliche Besucher seien nebensächlich, Sie bräuchten bis zum nächsten Quartal einen MCP Server, sonst verschwinden Sie. Behandeln Sie das so, wie Sie jeden Verkaufspitch behandeln würden, der mit “jetzt kaufen oder für immer verlieren” endet.
Mehrere Dinge sind gleichzeitig wahr, und alle zusammen auszuhalten ist die ehrliche Haltung.
Die Standards sind real und die Menschen dahinter sind seriös. NLWeb stammt von der Person, die uns Schema.org mit aufgebaut hat. MCP hat bereits breite Verbreitung als Weg für Agenten, Werkzeuge zu nutzen. AIPREF wird von der IETF gebaut. Das ist keine Luftnummer.
Aber die Verbreitung ist früh und die Hürden sind konkret. Umfragen unter Verlagen nennen technische Komplexität und schlicht organisatorische Bereitschaft als Hauptgründe, warum sie agentische Werkzeuge nicht eingeführt haben, nicht mangelndes Interesse. Standards, die noch im Entwurf sind, werden sich ändern. Und die Risiken wachsen mit den Fähigkeiten: Ein Agent, der im Auftrag eines Nutzers lesen, vergleichen und handeln kann, ist auch ein Agent mit Zugang zu sensiblen Präferenzen und zu Geld, und genau deshalb existiert überhaupt die Einwilligungsebene, die AIPREF zu standardisieren versucht.
Die vernünftige Schlussfolgerung ist also weder “ignorieren” noch “Panik”. Es ist Reihenfolge. Die meisten kleinen und mittleren Websites holen weit mehr Wert, und das schneller, aus besserer Inhaltsstruktur, saubereren Daten, einfacheren Conversion Wegen und stärkeren Vertrauenssignalen heraus als aus dem Wettlauf, einen Protokollserver auf einem wackeligen Fundament hochzuziehen. Eine Roadmap auf eine Entwurfsspezifikation zu setzen ist der Weg, ein Quartal mit etwas zu verbringen, das die Spezifikation danach unter Ihnen ändert. Wer eine längere Version dieses Arguments für die KI Suche allgemein möchte, findet sie in Ist SEO 2026 tot.
Nichts davon bedeutet, dass die Protokollebene keine Rolle spielt. Es bedeutet, dass die Reihenfolge eine Rolle spielt. Bringen Sie das Fundament in Ordnung, denn das Fundament ist das, woraus jeder dieser Standards liest, und es ist der einzige Teil, der sich auszahlt, ob das agentische Web nächstes Jahr ankommt oder fünf Jahre braucht.
Wo ein Crawler ins Bild kommt
Die unglamouröse Wahrheit, die sich durch all das zieht, ist, dass “bereit für Agenten” und “bereit für die Suche” fast dieselbe Checkliste sind. Crawlbare Seiten. Keine defekten Links. Korrekte Statuscodes. Kein versprengtes noindex. Schema vorhanden und vollständig. Vorhersehbare Struktur. Ein Agent und ein Suchbot scheitern an denselben Problemen.
Diese Überschneidung ist eine gute Nachricht, denn sie bedeutet, dass Sie Ihre Bereitschaft mit Werkzeugen messen können, die Sie bereits verstehen. Ein Crawl Ihrer eigenen Website bringt genau die Grundlagenprobleme ans Licht, die beide blockieren: Seiten, die 4xx oder 5xx zurückgeben, Links, die ins Leere führen, fehlende oder dünne strukturierte Daten, gesperrte oder auf noindex gesetzte Seiten, die Sie gar nicht verstecken wollten. Für genau diesen Durchlauf ist Seodisias gebaut. Sie richten es auf Ihre Website, ohne URL Grenze, und es meldet die defekten Links, die falschen Statuscodes, das fehlende Schema und die gesperrten Seiten in einem Durchgang, dieselben Mängel, die einen KI Agenten und einen Suchcrawler gleichermaßen stören.
Das Fazit
NLWeb, MCP und AIPREF sind es wert, verstanden zu werden, und einer von ihnen, AIPREF, ist es wert, genau beobachtet zu werden, weil er berührt, wie Ihre Inhalte rechtlich genutzt werden dürfen. Aber keiner von ihnen ändert die Arbeit, die Sie diesen Monat tun sollten. Machen Sie Ihre Website sauber, crawlbar, gut strukturiert und ehrlich in ihren Daten. Dieses Fundament ist das, was das agentische Web lesen soll, es ist das, was Suchmaschinen bereits belohnen, und es ist der einzige Teil dieser Geschichte, der reif genug ist, um heute danach zu handeln. Für eine nüchterne Lesart, wo die offizielle Leitlinie zu all dem steht, ist Googles eigener KI Optimierungsleitfaden, erklärt ein guter Begleiter zu diesem Beitrag.