Crawl budget: qué es y cómo optimizar para SEO
Por Tiago CostaActualizado el 2 de julio de 2026

Crawl budget (presupuesto de rastreo) es el número de páginas que un buscador está dispuesto a rastrear en un sitio en un periodo. Depende de dos factores:
- el límite de rastreo, ligado a la velocidad y la salud del servidor;
- la demanda de rastreo, ligada a la popularidad y a la frecuencia de actualización del contenido.
Qué es el crawl budget (presupuesto de rastreo)
Crawl budget, o presupuesto de rastreo, es la cantidad de páginas que un buscador como Google está dispuesto a rastrear en un sitio dentro de un periodo determinado. Es el límite práctico de atención que el robot, el crawler, dedica a tu dominio antes de pasar a otros sitios.
Ese presupuesto no es un número fijo que Google publique. Surge de la combinación de dos fuerzas: cuánto aguanta tu servidor las visitas sin volverse lento y cuánto cree el buscador que tu contenido merece ser revisitado. En sitios con pocas páginas, el robot suele con todo de sobra. En sitios con decenas de miles de URLs, cada rastreo pasa a ser un recurso disputado.
Conviene separar dos procesos que suelen confundirse: rastrear es que el robot visite la página y lea el código, mientras que indexar es decidir guardar esa página en el índice para que pueda posicionar. El crawl budget afecta a la primera etapa, que es la puerta de entrada a la indexación.
Cómo Google define el crawl budget: crawl rate y crawl demand
Google describe el presupuesto de rastreo como el encuentro de dos componentes. Saber qué significa cada uno ayuda a entender dónde se puede actuar:
| Componente | Qué es y qué influye |
|---|---|
| Límite de rastreo (crawl rate) | El máximo de peticiones que el robot hace sin sobrecargar el servidor. Un sitio rápido y estable recibe al robot con más frecuencia; un servidor lento o lleno de errores hace que Google frene. |
| Demanda de rastreo (crawl demand) | Cuánto quiere Google visitar el sitio. Las páginas populares, con enlaces apuntando a ellas, y el contenido que cambia con frecuencia despiertan más demanda que las páginas paradas e ignoradas. |
En la práctica, el crawl budget es el menor de los dos: no sirve tener un servidor potente si Google no ve motivo para volver, ni tener contenido deseado si el servidor se cae en cada visita. Mejorar el rastreo significa cuidar ambos lados a la vez.

Cuándo debes preocuparte por el crawl budget
Para la mayoría de los sitios, el presupuesto de rastreo no es un cuello de botella. El robot rastrea todo lo que necesita y aún sobra. La cuenta cambia cuando el sitio crece y empieza a generar muchas URLs. Presta atención si tu caso es uno de estos:
- sitios grandes, con más de diez mil páginas relevantes;
- tiendas y catálogos que crean muchas URLs a partir de filtros y parámetros de URL;
- portales de noticias y sitios que publican o actualizan contenido todo el tiempo;
- dominios con muchas páginas de baja calidad compitiendo por la atención del robot.
Cuando el rastreo se vuelve un cuello de botella, el efecto es silencioso: las páginas nuevas tardan en aparecer en Google y las actualizadas siguen mostrando la versión antigua. Según Botify, en sitios grandes y sin optimizar Google llega a rastrear, de media, solo cerca del 40% de las URLs estratégicas cada mes, lo que deja buena parte del contenido importante sin visita del robot.
Qué desperdicia tu presupuesto de rastreo
Buena parte del crawl budget se pierde en páginas que no deberían consumir tiempo del robot. Los desagües más comunes son:
- Contenido duplicado: varias URLs con el mismo contenido hacen que el robot rastree lo mismo de nuevo. Una URL canónica bien definida concentra el esfuerzo en la versión correcta.
- Cadenas de redirección: una cadena de redirecciones obliga al robot a dar varios saltos para llegar al destino, gastando rastreo en vano.
- URLs infinitas de parámetros: los filtros de color, tamaño y orden multiplican direcciones casi idénticas.
- Páginas de error y soft 404: las páginas rotas o con soft 404 consumen visitas sin entregar nada útil.
- Contenido pobre: muchas páginas de thin content diluyen la atención del robot entre direcciones que nadie busca.
Cada una de esas visitas desperdiciadas es una visita menos para las páginas que de verdad importan. Cortar el exceso es el primer paso para que el robot gaste el presupuesto donde vale la pena.

Cómo optimizar el crawl budget en la práctica
Optimizar el rastreo es, ante todo, guiar al robot hacia el contenido correcto y alejarlo de la basura. Una buena hoja de ruta:
- Bloquea lo inútil en robots.txt: usa el robots.txt para impedir el rastreo de áreas sin valor de búsqueda, como carritos, filtros y páginas internas de sistema.
- Mantén un sitemap limpio: el sitemap XML debe listar solo las URLs que quieres indexadas, sin redirecciones ni páginas bloqueadas.
- Corrige redirecciones y errores: acorta las cadenas de redirección y elimina los enlaces internos que apuntan a páginas rotas.
- Acelera el servidor: un sitio rápido eleva el límite de rastreo; la velocidad es parte del SEO técnico.
- Refuerza los enlaces internos: un buen enlace interno señala al robot qué páginas son prioritarias y ayuda a distribuir el rastreo.
- Consolida el contenido débil: junta o elimina páginas pobres para concentrar el presupuesto en lo que da resultado.
Una observación importante: bloquear una página en robots.txt ahorra rastreo, pero no la quita del índice. Para retirar una página de los resultados, el camino es el noindex, y no el bloqueo del rastreo.
Cómo monitorear el rastreo en Google Search Console
No necesitas adivinar cómo trata Google a tu sitio. El Google Search Console ofrece el informe de Estadísticas de rastreo, que muestra cuántas peticiones hizo el robot por día, el tiempo medio de respuesta del servidor y qué tipos de archivo y códigos de estado encontró.
Conviene seguir algunas señales: picos de errores de servidor, mucho tiempo gastado en páginas irrelevantes y páginas importantes rastreadas con poca frecuencia. Para revisar una URL concreta, la inspección de URL revela cuándo rastreó Google esa página por última vez y si fue indexada. Con esos datos en la mano, puedes actuar con precisión en lugar de a ciegas.