✨ Consigue 25% OFFen cualquier plan. Usa el cupón:

Crawl budget: qué es y cómo optimizar para SEO

Por Tiago CostaActualizado el 2 de julio de 2026

Ilustración de un robot rastreador recorriendo una pila de páginas con un medidor de presupuesto al lado, que representa el crawl budget.
Definición

Crawl budget (presupuesto de rastreo) es el número de páginas que un buscador está dispuesto a rastrear en un sitio en un periodo. Depende de dos factores:

  • el límite de rastreo, ligado a la velocidad y la salud del servidor;
  • la demanda de rastreo, ligada a la popularidad y a la frecuencia de actualización del contenido.

Qué es el crawl budget (presupuesto de rastreo)

Crawl budget, o presupuesto de rastreo, es la cantidad de páginas que un buscador como Google está dispuesto a rastrear en un sitio dentro de un periodo determinado. Es el límite práctico de atención que el robot, el crawler, dedica a tu dominio antes de pasar a otros sitios.

Ese presupuesto no es un número fijo que Google publique. Surge de la combinación de dos fuerzas: cuánto aguanta tu servidor las visitas sin volverse lento y cuánto cree el buscador que tu contenido merece ser revisitado. En sitios con pocas páginas, el robot suele con todo de sobra. En sitios con decenas de miles de URLs, cada rastreo pasa a ser un recurso disputado.

Conviene separar dos procesos que suelen confundirse: rastrear es que el robot visite la página y lea el código, mientras que indexar es decidir guardar esa página en el índice para que pueda posicionar. El crawl budget afecta a la primera etapa, que es la puerta de entrada a la indexación.

Cómo Google define el crawl budget: crawl rate y crawl demand

Google describe el presupuesto de rastreo como el encuentro de dos componentes. Saber qué significa cada uno ayuda a entender dónde se puede actuar:

ComponenteQué es y qué influye
Límite de rastreo (crawl rate)El máximo de peticiones que el robot hace sin sobrecargar el servidor. Un sitio rápido y estable recibe al robot con más frecuencia; un servidor lento o lleno de errores hace que Google frene.
Demanda de rastreo (crawl demand)Cuánto quiere Google visitar el sitio. Las páginas populares, con enlaces apuntando a ellas, y el contenido que cambia con frecuencia despiertan más demanda que las páginas paradas e ignoradas.

En la práctica, el crawl budget es el menor de los dos: no sirve tener un servidor potente si Google no ve motivo para volver, ni tener contenido deseado si el servidor se cae en cada visita. Mejorar el rastreo significa cuidar ambos lados a la vez.

Infografía que muestra el crawl budget como suma de límite y demanda de rastreo y los principales desperdicios: duplicadas, redirecciones, parámetros y errores.
Cómo se forma el crawl budget (límite más demanda) y qué desperdicia el presupuesto de rastreo.

Cuándo debes preocuparte por el crawl budget

Para la mayoría de los sitios, el presupuesto de rastreo no es un cuello de botella. El robot rastrea todo lo que necesita y aún sobra. La cuenta cambia cuando el sitio crece y empieza a generar muchas URLs. Presta atención si tu caso es uno de estos:

  • sitios grandes, con más de diez mil páginas relevantes;
  • tiendas y catálogos que crean muchas URLs a partir de filtros y parámetros de URL;
  • portales de noticias y sitios que publican o actualizan contenido todo el tiempo;
  • dominios con muchas páginas de baja calidad compitiendo por la atención del robot.

Cuando el rastreo se vuelve un cuello de botella, el efecto es silencioso: las páginas nuevas tardan en aparecer en Google y las actualizadas siguen mostrando la versión antigua. Según Botify, en sitios grandes y sin optimizar Google llega a rastrear, de media, solo cerca del 40% de las URLs estratégicas cada mes, lo que deja buena parte del contenido importante sin visita del robot.

Qué desperdicia tu presupuesto de rastreo

Buena parte del crawl budget se pierde en páginas que no deberían consumir tiempo del robot. Los desagües más comunes son:

  • Contenido duplicado: varias URLs con el mismo contenido hacen que el robot rastree lo mismo de nuevo. Una URL canónica bien definida concentra el esfuerzo en la versión correcta.
  • Cadenas de redirección: una cadena de redirecciones obliga al robot a dar varios saltos para llegar al destino, gastando rastreo en vano.
  • URLs infinitas de parámetros: los filtros de color, tamaño y orden multiplican direcciones casi idénticas.
  • Páginas de error y soft 404: las páginas rotas o con soft 404 consumen visitas sin entregar nada útil.
  • Contenido pobre: muchas páginas de thin content diluyen la atención del robot entre direcciones que nadie busca.

Cada una de esas visitas desperdiciadas es una visita menos para las páginas que de verdad importan. Cortar el exceso es el primer paso para que el robot gaste el presupuesto donde vale la pena.

Ilustración de un robot rastreador perdido entre páginas duplicadas y redirecciones, con el medidor de presupuesto casi vacío, que muestra el desperdicio de crawl budget.

Cómo optimizar el crawl budget en la práctica

Optimizar el rastreo es, ante todo, guiar al robot hacia el contenido correcto y alejarlo de la basura. Una buena hoja de ruta:

  • Bloquea lo inútil en robots.txt: usa el robots.txt para impedir el rastreo de áreas sin valor de búsqueda, como carritos, filtros y páginas internas de sistema.
  • Mantén un sitemap limpio: el sitemap XML debe listar solo las URLs que quieres indexadas, sin redirecciones ni páginas bloqueadas.
  • Corrige redirecciones y errores: acorta las cadenas de redirección y elimina los enlaces internos que apuntan a páginas rotas.
  • Acelera el servidor: un sitio rápido eleva el límite de rastreo; la velocidad es parte del SEO técnico.
  • Refuerza los enlaces internos: un buen enlace interno señala al robot qué páginas son prioritarias y ayuda a distribuir el rastreo.
  • Consolida el contenido débil: junta o elimina páginas pobres para concentrar el presupuesto en lo que da resultado.

Una observación importante: bloquear una página en robots.txt ahorra rastreo, pero no la quita del índice. Para retirar una página de los resultados, el camino es el noindex, y no el bloqueo del rastreo.

Cómo monitorear el rastreo en Google Search Console

No necesitas adivinar cómo trata Google a tu sitio. El Google Search Console ofrece el informe de Estadísticas de rastreo, que muestra cuántas peticiones hizo el robot por día, el tiempo medio de respuesta del servidor y qué tipos de archivo y códigos de estado encontró.

Conviene seguir algunas señales: picos de errores de servidor, mucho tiempo gastado en páginas irrelevantes y páginas importantes rastreadas con poca frecuencia. Para revisar una URL concreta, la inspección de URL revela cuándo rastreó Google esa página por última vez y si fue indexada. Con esos datos en la mano, puedes actuar con precisión en lugar de a ciegas.

Preguntas frecuentes

Preguntas frecuentes

¿Qué es el crawl budget en SEO?

El crawl budget es la cantidad de páginas que Google está dispuesto a rastrear en tu sitio en un periodo. Combina la capacidad de tu servidor para soportar las visitas del robot con el interés del buscador en volver a ese contenido. Cuanto mejor administrado, más rápido se descubren y actualizan tus páginas importantes en el índice.

¿Cuándo debo preocuparme por el crawl budget?

El crawl budget se vuelve prioridad en sitios grandes, con muchos miles de páginas, en tiendas que generan muchas URLs por filtros y en portales que publican o actualizan contenido todo el tiempo. Para un blog pequeño o mediano, Google suele rastrear todo sin dificultad, así que el foco debe estar en la calidad y la estructura del contenido.

¿Cómo verificar el crawl budget de mi sitio?

El camino principal es el informe de Estadísticas de rastreo en Google Search Console, que muestra cuántas peticiones hace el robot por día, el tiempo de respuesta del servidor y los códigos de estado encontrados. El análisis de los registros del servidor (log files) ofrece una visión aún más detallada de qué páginas visita realmente el robot.

¿Las páginas con noindex gastan crawl budget?

Sí. Para saber que una página tiene la directiva noindex, Google necesita rastrear esa página antes, así que aún consume rastreo. Si el objetivo es ahorrar presupuesto en áreas sin valor, el bloqueo en robots.txt evita la visita; el noindex sirve para quitar la página de los resultados, no para ahorrar rastreo.

¿El crawl budget es un factor de posicionamiento?

No directamente. El crawl budget no es una nota que mejore la posición de una página. Afecta a la rapidez con que Google descubre, rastrea y actualiza tu contenido. Un buen rastreo es requisito para aparecer bien, pero lo que decide la posición son la relevancia, la calidad y la autoridad del contenido.

Un blog que Google rastrea sin esfuerzo

Automarticles crea y publica los artículos de tu blog sola, con una estructura limpia y enlaces internos que ayudan a Google a rastrear e indexar cada página en el momento justo.

Empezar prueba gratis
Sigue aprendiendo

Conceptos relacionados

CrawlerUn crawler es un programa robot que recorre la web de enlace en enlace, descargando y leyendo páginas para alimentar el índice de un buscador. También llamado spider, robot o bot, el ejemplo más conocido es Googlebot. El crawler es la primera etapa de la búsqueda: antes de que una página pueda ser indexada y posicionada, tiene que ser encontrada y leída por uno de estos rastreadores.IndexaciónLa indexación es el proceso por el que el buscador añade una página a su índice, la enorme base de datos que consulta para responder a las búsquedas. Tras rastrear y analizar el contenido, Google decide si almacena la página en el índice, y solo lo que está indexado puede aparecer en los resultados. En SEO, garantizar la indexación es el paso obligatorio antes de cualquier intento de posicionar: una página fuera del índice es, en la práctica, invisible para quien busca.Robots.txtRobots.txt es un archivo de texto simple, guardado en la raíz del dominio, que indica a los rastreadores de los buscadores qué partes de un sitio pueden o no rastrear. Sigue el Protocolo de Exclusión de Robots y controla el rastreo, no la indexación, por lo que no es la herramienta adecuada para ocultar una página de los resultados de búsqueda.SEO técnicoEl SEO técnico es el conjunto de optimizaciones que se hacen en la infraestructura de un sitio para que los buscadores puedan rastrear, entender, indexar y mostrar sus páginas de forma eficiente. Mientras el contenido se ocupa de lo que dice la página, el SEO técnico se ocupa de la base invisible que lo sostiene todo: velocidad de carga, estructura de URLs, arquitectura de enlaces internos, versión móvil, seguridad, datos estructurados, indexación y códigos de estado. Sin esa base en orden, hasta el mejor contenido puede no aparecer nunca en la búsqueda.