Herramienta gratis

Verificador de robots.txt

Por Tiago CostaActualizado el 01 de julio de 2026

Pega la URL del sitio y mira su robots.txt analizado: grupos de User-agent, reglas de bloqueo, Sitemaps y alertas. En tu navegador, sin registro.

URL del sitio

Guía rápida

Cómo leer y verificar el robots.txt

El robots.txt es un archivo de texto en la raíz del sitio, en tusitio.com/robots.txt, que les dice a los robots de búsqueda qué partes del sitio pueden rastrear. Un error simple en este archivo tumba el rastreo del sitio entero, así que conviene revisarlo de vez en cuando.

Cómo leer el robots.txt línea por línea

El archivo se organiza en grupos. Cada grupo empieza con un User-agent (el robot al que se aplican las reglas) y lista las directivas debajo. Las más usadas son Disallow (ruta que el robot no debe rastrear) y Allow (excepción que libera una ruta dentro de un bloqueo).

User-agent: * aplica las reglas a todos los robots. También puedes apuntar a uno específico, como Googlebot.
Disallow: /admin/ pide no rastrear nada dentro de /admin/.
Disallow: en blanco libera todo el sitio para ese grupo.
Sitemap: apunta a la URL completa de tu sitemap para ayudar al buscador a encontrar tus páginas.

Principales directivas y qué hacen

Directiva	Ejemplo	Qué hace
User-agent	User-agent: *	Define a qué robot se aplica el grupo de reglas
Disallow	Disallow: /carrito/	Pide al robot no rastrear esa ruta
Allow	Allow: /blog/	Libera una ruta dentro de un área bloqueada
Sitemap	Sitemap: https://tusitio.com/sitemap.xml	Indica dónde está el sitemap del sitio

Errores comunes en el robots.txt

Error	Efecto
Disallow: / para User-agent: *	Bloquea el sitio entero para los buscadores
robots.txt ausente	Google rastrea todo por defecto, sin tu orientación
Sin línea Sitemap	Pierdes una pista fácil que acelera el descubrimiento de páginas
Bloquear CSS y JS	Google puede renderizar la página de forma incompleta
Sitemap con URL relativa	La línea Sitemap exige la URL completa para leerse

Bloquear rastreo y bloquear indexación

Son cosas distintas. El Disallow en robots.txt pide al robot no rastrear la página. Para sacar una página del índice de Google, usa la meta etiqueta noindex en el <head> de la propia página. Detalle importante: una página bloqueada en robots.txt puede seguir apareciendo en la búsqueda, porque Google nunca llega a leer su noindex. Para quitarla del índice, libera el rastreo y usa noindex.

Preguntas frecuentes

Preguntas sobre robots.txt

¿El verificador es gratis?

Sí, gratis y sin registro. Pegas la URL del sitio y recibes el análisis del robots.txt al instante.

¿Dónde está el robots.txt de un sitio?

Siempre en la raíz del dominio, en tusitio.com/robots.txt. La herramienta deriva la origen de la URL que pegues y busca ese archivo automáticamente.

¿Qué significa Disallow: / ?

Es la regla que bloquea el sitio entero para el robot de ese grupo. Cuando aparece para User-agent: *, ningún buscador rastrea el sitio, así que la herramienta lo destaca en rojo.

¿El robots.txt impide la indexación en Google?

No directamente. Controla el rastreo. Para sacar una página del índice, usa la meta etiqueta noindex en la página y mantén el rastreo abierto para que Google pueda leerla.

¿Necesito declarar el Sitemap en el robots.txt?

No es obligatorio, pero ayuda mucho. La línea Sitemap le indica al buscador dónde están tus páginas y acelera el descubrimiento. La herramienta avisa cuando falta.

¿Se guardan mis datos?

La verificación corre bajo demanda y el contenido del robots.txt no se almacena.

Automarticles

¿Quieres un blog que ya nace con el SEO técnico correcto?

Automarticles crea tu blog completo, con robots.txt, sitemap, canonical y contenido optimizados para Google y para ser citado por IAs como ChatGPT. Sin trabajo manual.

Empezar gratis

Más herramientas gratis

Contador de CaracteresCuenta caracteres y palabras, y mira el límite de cada red.Contador de PalabrasCuenta palabras, mira el tiempo de lectura y tus palabras más usadas.Densidad de Palabras ClaveMira los términos más usados y la densidad de cada uno, en tiempo real.Índice de LegibilidadPrueba qué tan fácil de leer es tu texto, con una nota de 0 a 100.Vista previa de GoogleSimula el snippet de tu página en Google antes de publicar.Generador de SlugConvierte títulos en URLs amigables y listas para SEO.Generador de SchemaCrea el JSON-LD de FAQ, artículo, página, sitio web, producto y más en segundos.Generador de robots.txtCrea el robots.txt de tu sitio y copia el resultado listo.Constructor de UTMCrea URLs rastreables con parámetros UTM para tus campañas.Calculadora de ROI de SEOCalcula leads, ingresos, beneficio, ROI y payback de tu inversión en SEO.Generador de llms.txtCrea el llms.txt de tu sitio para que las IAs lo entiendan y lo citen.Generador de Títulos SEOGenera 8 títulos optimizados con IA, cada uno del tamaño correcto para Google.Generador de Meta DescriptionCrea meta descriptions de 150-160 caracteres con IA, listas para Google.Generador de Esquema de BlogCrea la estructura completa de un artículo con IA: H1, H2, H3 y conclusión.Generador de Ideas de Contenido10 ideas de blog con título y ángulo a partir de tu nicho, en segundos.Generador de FAQGenera 6 preguntas frecuentes con IA y el schema FAQPage listo para pegar.Reescritor de TextoReescribe y parafrasea cualquier texto con IA, en el tono que necesitas.Generador de IntroducciónCrea 3 introducciones con gancho, contexto y promesa usando IA.Generador de Conclusión de ArtículoEscribe el párrafo final de tu artículo con IA: síntesis, refuerzo y llamada a la acción.Generador de Brief de ContenidoCrea un briefing de SEO completo con IA para guiar a redactores y agencias.Generador de Alt TextCrea el texto alternativo de tus imágenes con IA, listo para accesibilidad y SEO.Verificador de Visibilidad en IAComprueba si ChatGPT conoce tu marca y cómo mejorar la visibilidad en IA.Generador de Meta TagsGenera title, description, Open Graph y Twitter Card listos para pegar en el head.Verificador de Voz PasivaEncuentra las frases en voz pasiva y haz tu texto más claro y directo.Analizador de TitularesRecibe una nota de 0 a 100 para tu titular y consejos para ganar más clics.Checklist de SEO26 puntos de SEO técnico, on-page, contenido y enlaces. Marca cada uno y mira tu progreso.Corrector GramaticalCorrige gramática, ortografía y puntuación con IA, sin cambiar el sentido.Resumidor de TextoConvierte textos largos en un resumen claro con IA, en segundos.Verificador de CanonicalRevisa la etiqueta canonical de cualquier página y los errores comunes.Verificador de Open GraphMira las etiquetas OG y Twitter de la página y cómo se ve el enlace al compartir.Verificador de EncabezadosRevisa la jerarquía de H1 a H6 de cualquier página y los errores comunes.Verificador de Enlaces RotosEncuentra errores 404 y enlaces caídos en cualquier página, internos y externos.Validador de Sitemap XMLValida tu sitemap.xml y mira URLs, tipo y errores comunes.Investigación de Palabras ClavePalabras clave con volumen, competencia y CPC reales de Google.Verificador de Dificultad de Palabra ClaveMira, de 0 a 100, qué tan difícil es posicionar cada palabra clave en Google.Analizador de SERPMira quién ocupa el Top 10 de Google para cualquier palabra clave.Compresor de ImágenesComprime y convierte imágenes en el navegador. Nada se envía a un servidor.Buscador de SitemapEncuentra el sitemap de cualquier sitio a partir de su URL.Buscador de RSSDescubre el feed RSS, Atom o JSON de cualquier sitio a partir de su URL.Checklist de GEO24 puntos para aparecer y ser citado en las respuestas de IA. Marca cada uno y mira tu progreso.Diagnóstico de SEO y GEOAnálisis de SEO gratis y preparación para IA, con la nota y lo que corregir.

Términos del glosario

CloakingEl cloaking es una técnica de black hat SEO que consiste en mostrar al buscador un contenido distinto del que se exhibe al usuario, con el objetivo de manipular el ranking. En la práctica, el servidor detecta si quien accede es el robot de Google o una persona y entrega versiones distintas de la misma URL. Como engaña tanto al buscador como al visitante, el cloaking está prohibido por las directrices de Google y puede llevar a la eliminación de la página de los resultados.NoindexNoindex es una directiva que indica a los buscadores que no incluyan una página en los resultados de búsqueda. Se aplica mediante una meta etiqueta robots en el HTML o mediante una cabecera HTTP, y hace que Google retire la página del índice aunque otros sitios la enlacen. A diferencia del robots.txt, que bloquea el rastreo, el noindex exige que la página siga siendo rastreable para que el buscador pueda leer la instrucción.CrawlerUn crawler es un programa robot que recorre la web de enlace en enlace, descargando y leyendo páginas para alimentar el índice de un buscador. También llamado spider, robot o bot, el ejemplo más conocido es Googlebot. El crawler es la primera etapa de la búsqueda: antes de que una página pueda ser indexada y posicionada, tiene que ser encontrada y leída por uno de estos rastreadores.Robots.txtRobots.txt es un archivo de texto simple, guardado en la raíz del dominio, que indica a los rastreadores de los buscadores qué partes de un sitio pueden o no rastrear. Sigue el Protocolo de Exclusión de Robots y controla el rastreo, no la indexación, por lo que no es la herramienta adecuada para ocultar una página de los resultados de búsqueda.

Ver el glosario