✨ Consigue 25% OFFen cualquier plan. Usa el cupón:

Qué es la cabecera X-Robots-Tag y cómo controlar la indexación

Por Tiago CostaActualizado el 2 de julio de 2026

Ilustración de una respuesta de servidor con la cabecera X-Robots-Tag noindex bloqueando un PDF y una imagen de la búsqueda.
Definición

La X-Robots-Tag es una cabecera HTTP que controla cómo el buscador indexa una URL. En la práctica:

  • viaja en la respuesta del servidor, fuera del HTML de la página;
  • acepta las mismas directivas que la meta robots, como noindex y nofollow;
  • es la única forma de aplicar noindex en PDF, imágenes y otros archivos no HTML;
  • permite aplicar reglas en masa por tipo de archivo en el servidor.

Qué es la cabecera X-Robots-Tag

La X-Robots-Tag es una cabecera HTTP, es decir, una línea de información que el servidor envía junto con la respuesta de una URL, incluso antes del contenido en sí. En esa cabecera puedes incluir directivas de indexación que indican a los buscadores cómo tratar esa página o archivo: si se puede indexar, si debe seguir los enlaces, si puede mostrar una versión en caché y así sucesivamente.

La diferencia central respecto a la conocida meta etiqueta robots es dónde vive la instrucción. La meta etiqueta está dentro del HTML, en la sección head de la página. En cambio, la X-Robots-Tag está en la respuesta del servidor, en un nivel anterior al contenido. Las dos consiguen el mismo efecto sobre la indexación, pero por caminos diferentes.

Esta distinción no es un detalle técnico sin importancia. Resuelve un problema real: cómo impedir la indexación de archivos que no tienen HTML, como un PDF o una imagen. Sin una sección head para recibir una meta etiqueta, esos archivos solo se pueden controlar con la cabecera HTTP.

X-Robots-Tag frente a la meta robots: cuándo usar cada una

Las dos herramientas entregan las mismas directivas, así que la elección depende de lo que necesitas controlar y de dónde es más práctico aplicar la regla:

  • Meta etiqueta robots: ideal para páginas HTML individuales. Basta con insertar la línea <meta name="robots" content="noindex"> en el head del documento. Es simple y no exige acceso al servidor.
  • X-Robots-Tag: ideal para archivos no HTML (PDF, imágenes, vídeos) y para aplicar reglas en masa. Como está en el servidor, puedes, por ejemplo, enviar noindex a todos los PDF de una carpeta de una sola vez.

Conviene reforzar una regla que confunde a mucha gente: tanto la meta etiqueta como la X-Robots-Tag solo funcionan si el buscador consigue rastrear la URL y leer la instrucción. Si bloqueas la misma página en robots.txt, el robot nunca llega a ver la cabecera, y la directiva de noindex se ignora. El bloqueo de rastreo y una directiva de indexación son cosas distintas que no deben combinarse en la misma URL.

Infografía que muestra la meta etiqueta robots en el HTML y la X-Robots-Tag en la cabecera HTTP convergiendo en el mismo resultado fuera del índice.
Dos caminos hacia el mismo noindex: la meta etiqueta robots en el HTML y la X-Robots-Tag en la cabecera HTTP.

Qué valores acepta la X-Robots-Tag

La X-Robots-Tag reconoce las mismas directivas que la meta etiqueta robots, y puedes combinar más de una, separadas por coma. Las más usadas:

ValorQué le dice al buscador
noindexNo incluir esta URL en los resultados de búsqueda.
nofollowNo seguir los enlaces contenidos en ese recurso.
noneAtajo para noindex y nofollow juntos.
noarchiveNo mostrar una versión en caché del recurso.
nosnippetNo mostrar fragmento de texto ni vista previa en el resultado.
unavailable_afterDejar de indexar la URL después de una fecha definida.

También es posible dirigir la directiva a un robot específico, nombrando el agente antes del valor (por ejemplo, aplicar la regla solo a Googlebot). Esa flexibilidad hace de la X-Robots-Tag una herramienta poderosa para quien gestiona muchos tipos de archivo diferentes.

Cómo configurar la X-Robots-Tag en el servidor

Como la X-Robots-Tag vive en la respuesta HTTP, la configuración se hace en el servidor web, no en el contenido. Los caminos más comunes:

  • Apache: en el archivo de configuración o en el .htaccess, una regla del tipo Header set X-Robots-Tag "noindex" puede combinarse con un filtro por extensión para alcanzar solo los PDF, por ejemplo.
  • Nginx: dentro del bloque del servidor, la directiva add_header X-Robots-Tag "noindex"; aplica la regla a las URLs que especifiques.
  • WordPress: los plugins de SEO permiten marcar tipos de contenido con noindex, y algunos ya se encargan de la cabecera para archivos de medios sin que toques el servidor.

El punto de atención es siempre el mismo: aplicar la regla al objetivo correcto. Un filtro mal configurado puede acabar enviando noindex a páginas importantes, así que cada cambio pide una prueba antes de ir a producción. Equivocarse aquí hunde páginas enteras de la búsqueda sin aviso.

Casos de uso: PDF, imágenes y archivos no HTML

Es en los archivos que no son páginas HTML donde la X-Robots-Tag brilla, porque en ellos la meta etiqueta simplemente no existe. Situaciones típicas:

  • PDF internos: catálogos, manuales y materiales que no quieres que compitan en los resultados con las páginas del sitio.
  • Imágenes sensibles: archivos que deben quedar accesibles para quien tiene el enlace, pero fuera de la búsqueda de imágenes.
  • Hojas de cálculo y documentos: exportaciones e informes que generan contenido duplicado o de bajo valor para la búsqueda.
  • Áreas de descarga: carpetas enteras que tienen más sentido fuera del índice.

Conviene recordar que estas directivas forman parte de un universo bien consolidado. Según el estudio del Web Almanac de HTTP Archive, en 2024 la directiva noindex estaba presente en cerca del 4,7% de las páginas en escritorio y el 3,9% en móviles, señal de que el control de indexación, ya sea por meta etiqueta o por cabecera, es una práctica común en la web. Para complementar, el texto alternativo sigue siendo el camino para describir imágenes que sí quieres indexar.

Ilustración de un PDF y una imagen con la cabecera X-Robots-Tag noindex, mantenidos fuera de la página de resultados de búsqueda.

Cómo verificar y evitar errores con la X-Robots-Tag

Como la cabecera no aparece en el HTML visible, es fácil aplicarla sin querer u olvidar quitarla. Una rutina para comprobar que todo está bien:

  • Inspecciona las cabeceras HTTP: las herramientas de desarrollador del navegador o los verificadores de cabecera muestran si la X-Robots-Tag está presente y con qué valor.
  • Garantiza que la URL es rastreable: confirma que no está bloqueada en robots.txt, si no, el buscador no leerá la directiva.
  • Usa la inspección de URL: la herramienta de inspección de URL de Search Console indica si Google ve la página como excluida por una directiva noindex.
  • Comprueba el código de estado: un código de estado HTTP correcto, junto con la cabecera adecuada, evita señales contradictorias para el robot.

El error más caro de la X-Robots-Tag es el silencioso: un noindex olvidado en una regla amplia del servidor puede desindexar secciones enteras sin que nadie lo note de inmediato. Revisar las cabeceras tras cualquier cambio de infraestructura es la mejor forma de prevención.

Preguntas frecuentes

Preguntas frecuentes

¿Qué es la cabecera X-Robots-Tag?

La X-Robots-Tag es una cabecera HTTP enviada por el servidor con directivas de indexación para los buscadores, como noindex y nofollow. Cumple el mismo papel que la meta etiqueta robots, pero funciona para cualquier tipo de archivo, incluidos PDF e imágenes, que no tienen HTML para recibir una meta etiqueta.

¿Cuál es la diferencia entre la X-Robots-Tag y la meta etiqueta robots?

Las dos entregan las mismas directivas de indexación, pero en lugares diferentes. La meta etiqueta robots está dentro del HTML de la página, en el head. La X-Robots-Tag está en la respuesta HTTP del servidor. Para páginas HTML, la meta etiqueta es más simple; para archivos no HTML, la cabecera es la única opción.

¿Qué valores acepta la X-Robots-Tag?

La X-Robots-Tag acepta las mismas directivas que la meta robots, como noindex (no indexar), nofollow (no seguir enlaces), none (las dos juntas), noarchive (sin caché), nosnippet (sin fragmento) y unavailable_after (dejar de indexar tras una fecha). Puedes combinar varias, separadas por coma.

¿Cómo configurar la X-Robots-Tag en el servidor?

La configuración se hace en el servidor web. En Apache se usa una regla Header set X-Robots-Tag, normalmente en el .htaccess. En Nginx se usa add_header X-Robots-Tag dentro del bloque del servidor. En WordPress, los plugins de SEO pueden aplicar la cabecera a tipos de contenido y a archivos de medios.

¿Cómo verificar si la X-Robots-Tag está aplicada en una página?

Verificas la X-Robots-Tag inspeccionando las cabeceras HTTP de la respuesta, ya sea con las herramientas de desarrollador del navegador o con un verificador de cabecera en línea. La inspección de URL de Search Console también muestra si Google considera la página excluida por una directiva noindex.

Control de indexación en automático, sin error técnico

Automarticles crea, optimiza y publica los artículos de tu blog sola, cuidando las directivas de indexación para que el contenido correcto aparezca en Google.

Empezar prueba gratis
Sigue aprendiendo

Conceptos relacionados

NoindexNoindex es una directiva que indica a los buscadores que no incluyan una página en los resultados de búsqueda. Se aplica mediante una meta etiqueta robots en el HTML o mediante una cabecera HTTP, y hace que Google retire la página del índice aunque otros sitios la enlacen. A diferencia del robots.txt, que bloquea el rastreo, el noindex exige que la página siga siendo rastreable para que el buscador pueda leer la instrucción.Robots.txtRobots.txt es un archivo de texto simple, guardado en la raíz del dominio, que indica a los rastreadores de los buscadores qué partes de un sitio pueden o no rastrear. Sigue el Protocolo de Exclusión de Robots y controla el rastreo, no la indexación, por lo que no es la herramienta adecuada para ocultar una página de los resultados de búsqueda.Meta tagsLas meta tags son fragmentos de código colocados en el head HTML de una página que pasan información sobre ella a los buscadores y a las redes sociales, sin aparecer en el cuerpo visible del texto. Describen el título, el resumen, las directivas de indexación, el idioma y cómo debe mostrarse el enlace al compartirlo. Algunas influyen en el SEO de forma indirecta, otras controlan si la página aparece en los resultados y cómo lo hace.NofollowNofollow es un atributo de enlace, escrito como rel="nofollow" en el código HTML, que señala al buscador que no transfiera autoridad a la página de destino. El enlace sigue siendo clicable y lleva al usuario allí con normalidad, pero no cuenta como un voto de SEO. Se usa para enlaces de pago, contenido de usuarios y fuentes que no quieres respaldar, ayudando a mantener un perfil de backlinks natural y dentro de las directrices de Google.