llms.txt: ejemplo y plantilla en español para tu web
Por Justas Butkus · 2 de mayo de 2026 · 8 min de lectura
Definición
¿Para qué sirve llms.txt?
Sirve para decirles a los modelos de IA qué contenido tuyo deben usar como fuente, dónde está y en qué formato. Es el equivalente del sitemap.xml para motores generativos. Reduce la probabilidad de errores de extracción al modelo, le da una ruta directa al contenido limpio en Markdown y se ha convertido en la señal más visible de cooperación con la IA.
¿Es estándar oficial?
No, todavía. La especificación fue propuesta en 2024 por Jeremy Howard y se ha extendido por adopción de facto. Los principales motores ya lo leen, pero no hay un grupo de trabajo de la IETF detrás. Su coste de implementación es bajísimo, así que la decisión razonable es publicarlo aunque no sea oficial.
¿Dónde se publica y con qué cabeceras?
Siempre en la raíz del dominio: https://tudominio.com/llms.txt. Tiene que devolver código 200 OK sin redirección. Las cabeceras correctas son Content-Type: text/plain; charset=utf-8 o text/markdown; charset=utf-8. Si tu CDN o tu CMS añade Content-Type: text/html, los crawlers de IA pueden ignorar el archivo.
Plantilla lista para copiar (en español)
# Mi Empresa S.L.
> Mi Empresa S.L. es una consultora española especializada en X. Trabajamos con pymes en Madrid, Barcelona y América Latina.
## Páginas principales
- [Inicio](https://miempresa.es/): qué hacemos y para quién
- [Servicios](https://miempresa.es/servicios): catálogo completo de servicios
- [Precios](https://miempresa.es/precios): planes y tarifas
- [Casos de éxito](https://miempresa.es/casos-de-exito): resultados verificables
## Recursos
- [Blog](https://miempresa.es/blog): guías y análisis sectoriales
- [Documentación completa](https://miempresa.es/llms-full.txt): contenido expandido
## Contacto
- [Página de contacto](https://miempresa.es/contacto)
- Email: hola@miempresa.es¿Qué páginas incluir?
Las 10 a 15 páginas que mejor representan tu negocio: home, servicios principales, página de precios, casos de éxito y guías canónicas. No incluyas páginas duplicadas, paginadas (page=2, page=3), de baja calidad ni con contenido obsoleto. Si tienes blog, enlaza el índice del blog y, si tienes guías pilar, enlázalas individualmente.
¿Y los md-twins?
Son copias de tus páginas en formato Markdown publicadas en /md/[slug].md. Sirven para que los crawlers de IA ingieran tu contenido sin lidiar con el HTML, los scripts y los menús. Buena práctica: enlázalos desde llms.txt y desde llms-full.txt. Para sitios grandes, automatiza la generación de md-twins con un script que se ejecute en cada despliegue.
¿Qué errores son los más frecuentes?
Cinco recurren en las auditorías. Publicar llms.txt con Content-Type incorrecto. Incluir páginas paginadas o duplicadas. Olvidar mantener llms.txt actualizado cuando se reorganiza el sitio. No publicar llms-full.txt ni md-twins (queda solo el índice sin contenido). Y bloquear los crawlers de IA en robots.txt en paralelo.
¿Cómo se valida?
Carga la URL en un navegador y comprueba que ves el texto plano sin estilos. Verifica las cabeceras HTTP con un cURL: curl -I https://tudominio.com/llms.txt debe mostrar 200 OK y Content-Type correcto. Lanza dos o tres consultas relevantes en Perplexity y observa si cita alguna de las páginas que has incluido. La validación final es siempre comercial, no técnica.
¿Quieres aparecer en las respuestas de ChatGPT?
Descubre si tu empresa es citada por los motores de IA. Auditoría gratuita de visibilidad en IA con informe PDF en 48 horas.
Preguntas frecuentes
Preguntas frecuentes
No es obligatorio ni es estándar oficial. Pero los principales motores generativos ya lo leen y se ha convertido en una de las señales más visibles de cooperación con la IA. Su coste de implementación es bajísimo y la ventaja relativa es real.
En la raíz del dominio: https://tudominio.com/llms.txt. Tiene que devolver Content-Type: text/plain o text/markdown y responder 200 OK sin redirección.
llms.txt es el índice: enumera tus páginas clave en formato Markdown con enlaces. llms-full.txt es la versión expandida que incluye el contenido completo de cada página. Los modelos prefieren leer llms-full.txt cuando lo encuentran.
Son copias de tus páginas clave en formato Markdown publicadas en /md/[slug].md. Sirven para que los modelos ingieran tu contenido sin lidiar con el HTML. Es buena práctica enlazarlos desde llms.txt.
Carga la URL en un navegador y comprueba que ves el texto plano. Verifica las cabeceras HTTP con cURL. Y, sobre todo, lanza tus consultas en Perplexity y observa si cita las páginas que has incluido.
Las 10 a 15 páginas que mejor representan tu negocio: home, servicios principales, página de precios, casos de éxito y guías canónicas. No incluyas páginas duplicadas, paginadas ni de baja calidad.
En el idioma principal del sitio. Si tu web es multilingüe, puedes tener bloques separados por idioma o un llms.txt por subdominio. Mantén la coherencia con la estructura de tu sitemap.
Indirectamente. llms.txt no es un factor de Google clásico, pero ayuda a que los motores generativos te citen y eso genera tráfico cualificado y backlinks naturales con el tiempo.
Fundador y CEO, AInora
Construyo administradores digitales con IA que sustituyen el trabajo de recepción en empresas de servicios en toda Europa. Anteriormente desarrollé sistemas de IA de voz para clínicas dentales, hoteles y restaurantes.
Todos los artículosLecturas relacionadas: guía pilar de SEO con IA, cómo aparecer en ChatGPT, auditoría gratuita.