Was ist llms.txt?
llms.txt ist eine Textdatei, die im Stammverzeichnis einer Website liegt – genau wie robots.txt oder sitemap.xml. Der Unterschied: llms.txt richtet sich nicht an Suchmaschinen-Crawler, sondern an Large Language Models (LLMs) wie ChatGPT, Claude, Perplexity oder Gemini.
Die Datei beschreibt in strukturierter, lesbarer Form, was eine Website oder ein Unternehmen anbietet, für wen und in welchem Kontext. Sie gibt KI-Systemen damit eine verlässliche Informationsquelle, die sie bei der Beantwortung von Nutzeranfragen heranziehen können.
Der Vorschlag stammt von Jeremy Howard (fast.ai) und wurde Ende 2024 veröffentlicht. Seitdem haben immer mehr Websites eine llms.txt-Datei implementiert – von Tech-Unternehmen über Agenturen bis hin zu Bildungseinrichtungen.
Das Problem, das llms.txt löst
Wenn jemand ChatGPT fragt: „Welche Agentur in Köln macht gute TYPO3-Websites?“, dann durchsucht das System seine Trainingsdaten und – je nach Modell – auch das Live-Web. Die Antwort hängt davon ab, welche Informationen das System über dich findet und wie gut es sie einordnen kann.
Das Problem: Eine typische Unternehmenswebsite ist für Menschen gemacht. Navigation, Design, Bildsprache – alles optimiert für den menschlichen Besucher. Für ein KI-System, das Text verarbeitet, ist ein Großteil davon Rauschen. Menüs, Footer-Links, Cookie-Banner, JavaScript-Elemente – all das muss das System filtern, um an den eigentlichen Inhalt zu kommen.
llms.txt liefert genau diesen Inhalt: klar strukturiert, maschinenlesbar, auf das Wesentliche reduziert. Statt eine komplette Website zu crawlen und zu interpretieren, bekommt das KI-System eine Kurzfassung, die die wichtigsten Informationen direkt zugänglich macht.
Was in einer llms.txt steht
Das Format ist bewusst einfach gehalten. Eine llms.txt-Datei ist reiner Markdown-Text mit einer klaren Struktur:
Die Grundstruktur
- Titel: Name des Unternehmens oder der Website
- Beschreibung: Ein Absatz, der erklärt, wer du bist und was du anbietest
- Abschnitte: Thematische Blöcke mit Links zu den wichtigsten Seiten
Beispiel: So sieht eine llms.txt aus
Für ein Unternehmen wie RHEINFORMAT könnte die Struktur so aussehen:
# RHEINFORMAT – Studio für digitale Kommunikation > RHEINFORMAT ist ein Studio für digitale Kommunikation in Köln. > Inhaber Axel Nicol entwickelt Websites, digitale Plattformen > und Online-Marketing-Strategien für kleine und mittlere > Unternehmen. Schwerpunkte: TYPO3-Entwicklung, SEO und > strategische Beratung. ## Leistungen - [Websites & Digitale Plattformen](/websites-digitale-plattformen) - [Strategie & Konzeption](/strategie-konzeption) - [Content & Sichtbarkeit](/content-sichtbarkeit) - [TYPO3-Entwicklung](/typo3-entwicklung) ## Wissen - [Was kostet eine professionelle Website?](/wissen/was-kostet-professionelle-website) - [SEO für KMU](/wissen/seo-fuer-kmu-so-wirst-du-in-deiner-region-gefunden)
Optionale Erweiterung: llms-full.txt
Neben der kompakten llms.txt gibt es die Möglichkeit, eine ausführlichere Version als llms-full.txt bereitzustellen. Diese enthält mehr Kontext, längere Beschreibungen und detailliertere Informationen zu einzelnen Leistungen oder Artikeln. KI-Systeme können je nach Bedarf die Kurzversion oder die Vollversion abrufen.
llms.txt vs. robots.txt – der Unterschied
Beide Dateien liegen im Stammverzeichnis einer Website, verfolgen aber unterschiedliche Ziele:
| Aspekt | robots.txt | llms.txt |
|---|---|---|
| Zielgruppe | Suchmaschinen-Crawler | KI-Sprachmodelle |
| Funktion | Sagt, was gecrawlt werden darf | Sagt, was die Website inhaltlich bietet |
| Format | Eigene Syntax (Allow/Disallow) | Markdown |
| Seit wann | 1994 (30+ Jahre Standard) | 2024 (neuer Vorschlag) |
| Verbindlichkeit | De-facto-Standard, breit unterstützt | Freiwillig, wachsende Verbreitung |
| Analogie | Türsteher (regelt Zugang) | Visitenkarte (erklärt, wer du bist) |
Der entscheidende Punkt: robots.txt und llms.txt ergänzen sich. robots.txt regelt, welche Seiten gecrawlt werden dürfen. llms.txt erklärt, was die Website inhaltlich bietet. Beides zusammen gibt KI-Systemen die bestmögliche Orientierung.
Wie du eine llms.txt erstellst
Schritt 1: Inhalte sammeln
Bevor du schreibst, beantworte diese Fragen:
- Wer bist du / was ist dein Unternehmen?
- Was bietest du an? (Leistungen, Produkte)
- Für wen? (Zielgruppe, Region)
- Was unterscheidet dich?
- Welche Seiten sind die wichtigsten?
Schritt 2: Datei schreiben
Erstelle eine Textdatei mit der Endung .txt im Markdown-Format. Halte dich an die Struktur: Titel, Beschreibung, Abschnitte mit Links. Formuliere klar und sachlich – keine Werbesprache, keine Floskeln. KI-Systeme bevorzugen faktische, präzise Informationen.
Schritt 3: Unter /llms.txt bereitstellen
Die Datei muss unter deine-domain.de/llms.txt erreichbar sein. Das ist dieselbe Konvention wie bei robots.txt: fester Pfad, keine Weiterleitung.
Checkliste für eine gute llms.txt
| Kriterium | Prüfung |
|---|---|
| Erreichbar unter /llms.txt | Direkt aufrufbar, HTTP 200 |
| Reines Markdown | Keine HTML-Tags, kein JavaScript |
| Beschreibung in 2–4 Sätzen | Wer + Was + Für wen + Wo |
| Wichtigste Seiten verlinkt | 5–15 Links, beschreibend |
| Aktuell | Leistungen und Inhalte stimmen |
| Keine Werbesprache | Fakten statt Marketing |
| UTF-8-Encoding | Umlaute korrekt dargestellt |
llms.txt in TYPO3 einbinden
In TYPO3 gibt es verschiedene Wege, eine statische Textdatei unter einem festen Pfad auszuliefern:
Option 1: Statische Datei (einfachster Weg)
Die llms.txt-Datei direkt in das Webroot-Verzeichnis legen – also dorthin, wo auch die robots.txt liegt. Das funktioniert in jeder TYPO3-Installation und braucht keine Extension.
Option 2: Über TypoScript (dynamisch)
Wer die Datei aus TYPO3-Inhalten generieren möchte (etwa um Leistungsseiten und Wissensartikel automatisch aufzulisten), kann das über eine eigene PAGE-Konfiguration mit typeNum lösen. So bleibt die llms.txt immer synchron mit den aktuellen Inhalten.
Option 3: Via .htaccess/Webserver-Konfiguration
Ein Rewrite-Rule, das Anfragen an /llms.txt auf eine beliebige Datei im Dateisystem weiterleitet. Nützlich, wenn die Datei außerhalb des TYPO3-Webroot verwaltet wird.
Für die meisten Projekte ist Option 1 der pragmatische Einstieg. Wenn sich die Inhalte häufig ändern, lohnt sich der Umstieg auf Option 2.
Was llms.txt heute schon bringt
Sofort-Effekte
- Klarere KI-Antworten: Wenn ein KI-System deine llms.txt findet, hat es eine verlässliche Informationsquelle über dein Unternehmen. Die Wahrscheinlichkeit steigt, dass Antworten zu Fragen über dein Fachgebiet oder deine Region dein Unternehmen korrekt einordnen.
- Reduziertes Halluzinationsrisiko: Ohne llms.txt interpretiert das KI-System verstreute Informationen aus verschiedenen Quellen. Mit llms.txt lieferst du eine autorisierte Selbstbeschreibung.
- Early-Adopter-Vorteil: Noch haben die wenigsten Mittelständler eine llms.txt. Wer jetzt anfängt, ist früh in den Trainingsdaten und im Live-Crawling der KI-Systeme präsent.
Was noch kommt
llms.txt ist ein junger Standard, der sich weiterentwickelt. Es ist absehbar, dass KI-Suchsysteme wie Perplexity, SearchGPT und Google AI Overviews diese Dateien systematischer auswerten werden. Die Investition ist minimal (eine Textdatei erstellen und pflegen), das Potenzial wächst mit jedem Monat.
Einordnung: Kein Allheilmittel
llms.txt allein macht dein Unternehmen nicht sichtbar in KI-Systemen. Die Datei ist ein Baustein in einem größeren Bild – eine professionelle KI-Beratung betrachtet alle relevanten Maßnahmen gemeinsam. Strukturierte Daten (Schema Markup), gute Inhalte, konsistente Markensignale und eine saubere technische Basis bleiben die Grundlage. llms.txt ergänzt das Fundament um einen gezielten Kanal zu KI-Systemen.
Häufige Fragen
Liest ChatGPT meine llms.txt wirklich?
ChatGPT mit aktivierter Websuche kann auf llms.txt zugreifen, ebenso wie Perplexity und andere KI-Systeme mit Web-Zugang. Für die Antwortgenerierung ohne Live-Suche (reine Modell-Antworten) zählt, ob die Datei in den Trainingsdaten enthalten ist. Je früher du die Datei bereitstellst, desto wahrscheinlicher ist das bei zukünftigen Modell-Updates.
Kann llms.txt meinem Google-Ranking schaden?
Die Datei hat keinen direkten Einfluss auf das Google-Ranking. Sie richtet sich an KI-Systeme, nicht an den Google-Crawler. Indirekt kann eine llms.txt sogar helfen, weil die klare Informationsstruktur auch von Google AI Overviews berücksichtigt werden kann.
Wie oft sollte ich die Datei aktualisieren?
Immer dann, wenn sich deine Leistungen, dein Angebot oder die wichtigsten Seiten deiner Website ändern. In der Praxis heißt das: bei einem Relaunch, bei neuen Leistungsseiten oder wenn wesentliche Wissensartikel hinzukommen. Ein halbjährlicher Check reicht für die meisten Unternehmen.
Brauche ich eine llms.txt, wenn ich schon gutes SEO mache?
SEO und llms.txt adressieren unterschiedliche Systeme. SEO optimiert für Google und andere Suchmaschinen. llms.txt optimiert für KI-Sprachmodelle. In einer Welt, in der immer mehr Suchanfragen über KI-Systeme laufen, ist beides sinnvoll. Der Aufwand für llms.txt ist dabei minimal.
Gibt es einen Nachteil, wenn ich zu viel in die llms.txt schreibe?
Die Datei sollte kompakt bleiben. Zu viel Text verwässert die Kernaussage. Für ausführliche Informationen gibt es die optionale llms-full.txt. Die Hauptdatei sollte auf 50–100 Zeilen passen – knapp, präzise und aktuell.
Fazit: Kleine Datei, wachsende Bedeutung
llms.txt ist eine der einfachsten Maßnahmen, die du für die KI-Sichtbarkeit deines Unternehmens umsetzen kannst. Eine Textdatei, 30 Minuten Aufwand, keine laufenden Kosten. Der Standard ist jung, aber die Richtung ist klar: KI-Systeme werden in den kommenden Jahren eine immer größere Rolle bei der Suche nach Dienstleistern und Informationen spielen.
Wer jetzt eine llms.txt erstellt, investiert minimal und positioniert sich früh.
Du möchtest deine Website für KI-Systeme sichtbar machen? Lass uns darüber sprechen, was in deinem Fall sinnvoll ist – von llms.txt über Schema Markup bis zur vollständigen GEO-Strategie.
Mehr über KI und Sichtbarkeit:
- Von SEO zu GEO: Was sich für KMU ändert
- KI-Sichtbarkeit: Wie deine Website in ChatGPT und Perplexity auftaucht
Mehr über Content & Sichtbarkeit bei RHEINFORMAT: Content & Sichtbarkeit