llms.txt multilingüe: cómo estructurarlo para un sitio con varios idiomas

El archivo llms.txt ha pasado de ser una idea de nicho a algo que muchos sitios ya publican: un resumen limpio de tu sitio en markdown que los rastreadores y asistentes de IA pueden leer sin vadear tu HTML. Para un sitio de un solo idioma es sencillo. Pero en cuanto tu sitio habla más de un idioma, aparece una pregunta real: ¿necesitas un llms.txt o uno por idioma? Y si lo haces mal, puedes entregar en silencio a los modelos de IA solo una fracción del contenido que de verdad tienes.
Esta guía recorre cómo estructurar llms.txt entre idiomas, cómo mantenerlo coherente con la configuración de hreflang que ya tienes, y los errores que dejan la mayor parte de tu sitio invisible para la búsqueda con IA.
Un repaso rápido a llms.txt
llms.txt vive en la raíz de tu dominio y le da a los grandes modelos de lenguaje un mapa conciso y lleno de enlaces de tu sitio en markdown: quién eres, tus páginas clave, tu contenido principal, a menudo con un llms-full.txt que contiene el texto completo. Es para los rastreadores de IA lo que un sitemap limpio es para los buscadores, una señal deliberada de lo que importa. Si el concepto es nuevo, va de la mano del trabajo de nuestra guía de robots.txt para bots de IA y del panorama de la optimización para motores generativos.
La versión de un idioma es sencilla. En la versión multilingüe es donde los equipos se atascan.
La pregunta multilingüe: ¿un archivo o muchos?
Cuando tu sitio tiene, por ejemplo, versiones en inglés, alemán y español, hay tres formas plausibles para llms.txt:
- Un llms.txt, un solo idioma. El valor por defecto fácil y el error más común. Tu llms.txt en inglés lista solo páginas en inglés, y tu contenido en alemán y español simplemente no existe para un rastreador de IA que lea ese archivo.
- Un llms.txt con todos los idiomas mezclados. Todo está listado, pero los enlaces en inglés, alemán y español quedan en un montón indistinguible, sin señal de qué idioma debería seguir un lector o un modelo.
- Un llms.txt por idioma, con una estructura de idioma clara. Cada idioma tiene su propio archivo limpio, y están enlazados entre sí para que un rastreador pueda encontrar cada versión. Esta es la forma que de verdad escala.
La tercera opción es la que vale la pena construir.
La estructura que funciona
El patrón que aguanta refleja cómo ya gestionas el SEO multilingüe:
- Un llms.txt específico por idioma. Si tu contenido en alemán vive bajo
/de/, sirve unllms.txt(o un equivalente acotado al idioma) que liste las páginas en alemán, en alemán. Lo mismo para cada idioma. Cada archivo es coherente en sí mismo: un idioma, sus propias páginas, sus propias descripciones. - Una sección clara de otros idiomas. Dentro del archivo de cada idioma, enlaza a las otras versiones de idioma para que un rastreador que llegue a una pueda descubrir el resto. Es el eco en llms.txt de los enlaces recíprocos de hreflang.
- Genéralo en tiempo de compilación. Mantener a mano varios archivos de idioma es la forma en que se separan. Constrúyelos desde la misma fuente de contenido para que cada página publicada aparezca automáticamente en el archivo del idioma correcto y una traducción nueva aparezca sin que nadie tenga que acordarse de añadirla.
Hecho así, un rastreador de IA que aterriza en cualquier idioma ve una imagen completa y coherente y un camino hacia cada otra versión, en vez de un callejón sin salida en un idioma.
Mantenlo coherente con hreflang
Tu llms.txt debería coincidir con las señales que ya envías. Si tu implementación de hreflang le dice a los buscadores que /de/page es la versión en alemán de /page, tus archivos llms.txt deberían reflejar las mismas relaciones, no un mapa distinto o parcial. Cuando hreflang dice una cosa y llms.txt insinúa otra, estás enviando señales contradictorias sobre la forma de tu propio sitio.
El modelo mental más limpio: hreflang le dice a los buscadores cómo se relacionan tus versiones de idioma; el llms.txt multilingüe le cuenta a los rastreadores de IA la misma historia, en el formato que prefieren.
Errores comunes
Unas pocas trampas atrapan a la mayoría de los sitios multilingües:
- Publicar solo un idioma. El llms.txt por defecto solo en inglés que omite en silencio cada otro idioma que publicas. Este es el grande.
- Mezclar idiomas sin estructura. Listar todos los idiomas en un archivo plano sin agrupación ni enlaces cruzados, de modo que ni una persona ni un modelo distingan qué idioma es cuál.
- Dejar que se aparte del sitio en vivo. Un archivo editado a mano que se va quedando atrás a medida que se publican páginas traducidas, hasta que describe un sitio que ya no existe.
- Traducir los enlaces pero no las descripciones. Un archivo en alemán con URL en alemán pero resúmenes en inglés está solo medio localizado y se lee como hecho por una máquina.
- Olvidar el archivo de texto completo. Si ofreces
llms-full.txt, necesita el mismo tratamiento por idioma, o el contenido completo solo está disponible en un idioma.
Cómo ayuda Seodisias
La parte difícil del llms.txt multilingüe no es escribir un archivo; es ver si todos son coherentes con el sitio que de verdad tienes. Eso es un problema de rastreo. Seodisias es un rastreador de escritorio gratuito y multiplataforma que recorre todo tu sitio como lo hace un buscador, a través de cada ruta de idioma, y saca a la luz justo las brechas que rompen una configuración multilingüe: versiones de idioma sin contraparte, relaciones hreflang que no cuadran, páginas traducidas huérfanas que nunca llegaron a ningún archivo. Ves la estructura real de tu sitio multilingüe y luego haces que llms.txt coincida con ella en vez de adivinar. Sin cuenta, sin límite de URL, y tus datos de rastreo nunca salen de tu equipo. Para la visión técnica más amplia, consulta nuestra guía completa de rastreadores SEO.
En resumen
Un sitio multilingüe necesita un llms.txt multilingüe, no un único archivo en inglés que finge que el resto de tu contenido no está ahí. Dale a cada idioma su propio archivo limpio y coherente, enlázalos como hreflang enlaza tus páginas, y genéralos desde una sola fuente para que nunca se separen. Haz eso, y un rastreador de IA verá todo tu sitio en cada idioma que publicas, en vez de una cuarta parte. La forma no es complicada; solo tiene que coincidir con el sitio multilingüe que ya tienes.
¿Quieres ver si tus versiones de idioma y tu llms.txt de verdad encajan? Rastrea tu sitio gratis con Seodisias.