llms.txt: co to jest i jak go zrobić
Skrót
Czym jest llms.txt
llms.txt to plik tekstowy w katalogu głównym domeny (np. ainora.lt/llms.txt), który dostarcza modelom językowym (LLM) zwięzłe streszczenie firmy plus listę najważniejszych zasobów do cytowania. Standard zaproponowano we wrześniu 2024 i przejęły go Claude, Perplexity oraz, coraz częściej, ChatGPT i Gemini. Plik nie zastępuje sitemap.xml - uzupełnia go warstwą semantyczną.
Po co istnieje llms.txt
Modele AI parsują strony technicznie - ale renderowany HTML jest dla nich „szumem". Pliki czytelne tekstowo (txt, md) są przyswajane szybciej i precyzyjniej. llms.txt to taki indeks - mówi modelowi „zacznij tu, najważniejsze są te strony, w tej kolejności". Bez niego model wybiera losowo, z liniowym przeglądaniem witryny.
Gdzie się go umieszcza
Zawsze w katalogu głównym domeny: ainora.lt/llms.txt, twojafirma.pl/llms.txt. Plik powinien być dostępny publicznie (HTTP 200), zwracać Content-Type: text/plain, mieć kodowanie UTF-8.
Konkretny przykład pliku llms.txt
# Twoja Firma
> Twoja Firma to polski dostawca [usługi] dla [grupa docelowa]. Pomagamy klientom z [konkretny problem] poprzez [konkretne rozwiązanie]. Działamy od 2018 roku w [miasto/region].
## Strony główne
- [Strona główna](https://twojafirma.pl): Czym się zajmujemy, dla kogo, jak zacząć
- [Cennik](https://twojafirma.pl/cennik): Konkretne widełki cenowe per pakiet
- [O nas](https://twojafirma.pl/o-nas): Zespół, doświadczenie, certyfikaty
- [Kontakt](https://twojafirma.pl/kontakt): Telefon, e-mail, adres
## Usługi
- [Usługa A](https://twojafirma.pl/usluga-a): Opis, dla kogo, ile trwa
- [Usługa B](https://twojafirma.pl/usluga-b): Opis, cena, FAQ
## Blog (najważniejsze)
- [Najczęstszy problem klientów](https://twojafirma.pl/blog/najczestszy-problem)
- [Przewodnik wprowadzający](https://twojafirma.pl/blog/przewodnik)
## Pełny katalog
- llms-full.txt: https://twojafirma.pl/llms-full.txt
- Sitemap XML: https://twojafirma.pl/sitemap.xml
llms-full.txt - rozszerzenie
llms-full.txt to rozszerzona wersja zawierająca pełny katalog stron z opisami. W przeciwieństwie do llms.txt (który mieści się na 1-2 ekranach), llms-full.txt może mieć setki linii. Modele AI używają go, gdy llms.txt nie wystarcza do odpowiedzi na konkretne pytanie.
Bliźniaki Markdown (md-twins)
Trzeci element infrastruktury: dla każdej ważnej strony HTML udostępniaj odpowiednik w czystym Markdown pod adresem typu twojafirma.pl/md/[slug].md. Modele AI parsują czysty Markdown szybciej niż renderowany HTML, więc bliźniaki istotnie zwiększają szanse cytowania.
Częste błędy
- Plik z błędnym Content-Type - jako application/octet-stream zamiast text/plain
- Linki względne zamiast pełnych URL
- Brak streszczenia firmy w pierwszych 60-80 słowach
- Za dużo linków (200+) - rozprasza sygnał i obniża priorytet kluczowych zasobów
- Brak aktualizacji przy zmianach na stronie
- Skopiowany llms.txt z innej firmy - duplikat treści
Następny krok
Najczęściej zadawane pytania
Najczęściej zadawane pytania
To otwarty standard zaproponowany w 2024 roku, jeszcze nieratyfikowany przez żadną organizację typu W3C. Ale jest honorowany przez Anthropic Claude, Perplexity i coraz częściej przez ChatGPT i Gemini.
Tak. To dwa różne pliki. Sitemap mówi „te strony istnieją". llms.txt mówi „te strony są warte cytowania, oto ich logiczna struktura, oto co warto przeczytać najpierw".
Modele AI parsują witrynę normalnie, ale tracą kontekst struktury. Strony są oceniane indywidualnie zamiast jako spójna baza wiedzy. Cytowania są mniej częste i mniej trafne.
llms.txt - 30-100 wierszy, krótkie streszczenie firmy plus lista 20-50 najważniejszych zasobów. llms-full.txt - może mieć tysiące wierszy, pełny katalog stron.
Standard nie zabrania, ale zalecamy unikać. Modele parsują plik literalnie - komentarze mogą być potraktowane jako treść.
Tak, przy każdej istotnej zmianie struktury strony lub dodaniu kluczowego artykułu. W praktyce - raz na 2-4 tygodnie.
Pośrednio. Sam plik nie wpływa na ranking Google. Ale pomaga Google Gemini i AI Overviews wybierać Cię jako źródło - więc pośrednio tak.
Otwórz w przeglądarce ainora.lt/llms.txt - powinien pokazać czysty tekst, nie HTML. Sprawdź, czy linki działają. Walidatora oficjalnego jeszcze nie ma.
Założyciel i CEO, AInora
Buduję cyfrowych administratorów AI, którzy odciążają recepcje firm usługowych w całej Europie. Wcześniej tworzyłem głosowe systemy AI dla klinik dentystycznych, hoteli i restauracji.
Wszystkie artykuły