✨ Consigue 25% OFFen cualquier plan. Usa el cupón:

Qué es el Sitemap XML y cómo crearlo

Por Tiago CostaActualizado el 2 de julio de 2026

Ilustración de un archivo XML con una lista de URLs que apuntan a varios iconos de página, que representa un sitemap XML.
Definición

Un sitemap XML es un archivo que lista las URLs de un sitio en formato XML para orientar a los buscadores. Ayuda a Google a descubrir y priorizar páginas, sobre todo en sitios grandes o nuevos. Cada URL va dentro de una etiqueta <loc>, y el archivo suele estar en una dirección como /sitemap.xml.

Qué es un sitemap XML

Un sitemap XML es un archivo de texto en formato XML (eXtensible Markup Language) que lista las URLs que quieres que los buscadores conozcan. Cada dirección va dentro de una etiqueta <loc>, y la lista entera vive dentro de un elemento <urlset>.

Además de la dirección, cada entrada puede traer información opcional que da contexto al buscador:

  • <loc>: la URL de la página, el único campo obligatorio.
  • <lastmod>: la fecha de la última modificación, útil para señalar contenido actualizado.
  • <changefreq> y <priority>: pistas de frecuencia de cambio e importancia relativa, hoy poco consideradas por Google.

En la práctica, el sitemap es un mapa del sitio entregado en bandeja: en lugar de esperar a que el buscador lo encuentre todo solo mediante los enlaces, le das la lista de las direcciones que importan.

Para qué sirve el sitemap XML en SEO

El papel del sitemap es ayudar en el descubrimiento. Facilita el trabajo del crawler, el robot que recorre la web siguiendo enlaces, al entregar de una vez la relación de páginas que consideras relevantes.

Esto es especialmente valioso en algunos escenarios:

  • Sitios grandes: con miles de URLs, es fácil que alguna página quede mal conectada y pase desapercibida.
  • Sitios nuevos: todavía con pocos backlinks, dependen más del sitemap para ser encontrados.
  • Páginas aisladas: las direcciones con pocos enlaces internos apuntando a ellas ganan una vía directa de descubrimiento.

Un aviso importante: el sitemap ayuda en el descubrimiento, pero no garantiza la indexación. Google decide por su cuenta qué indexar, evaluando calidad y relevancia. Listar una URL en el sitemap es una invitación, no una orden.

Infografía de cuatro pasos que muestra el sitio, el sitemap XML, el rastreador de Google y el índice de búsqueda.
Cómo un sitemap XML lleva las URLs del sitio hasta el índice de Google.

Cómo crear un sitemap XML

No necesitas escribir el archivo a mano. Hay tres caminos principales, del más simple al más manual:

  • CMS y plugins: la mayoría de las plataformas generan el sitemap solas. En WordPress, los plugins de SEO crean y actualizan el archivo de forma automática con cada nuevo contenido.
  • Generadores online: herramientas que rastrean el sitio y devuelven un archivo listo, buenas para sitios estáticos o pequeños.
  • Generación manual o programática: en proyectos a medida, el propio sistema monta el XML a partir de la base de datos, manteniéndolo siempre al día.

Sea cual sea el método, la regla de oro es la misma: el sitemap debe listar solo URLs que realmente quieres en los resultados, cada una en su versión canónica, sin duplicados ni redirecciones.

Límites y buenas prácticas del sitemap XML

El formato tiene reglas claras. Según la documentación de Google Search Central, un único archivo de sitemap está limitado a 50 MB (sin comprimir) o 50.000 URLs. Quien supera esos números necesita dividir la lista en varios archivos.

Para sitios grandes, la solución es el sitemap index, un archivo que apunta a otros sitemaps, como un índice de índices. Así mantienes cada archivo dentro del límite y envías solo el índice a Google.

Otras buenas prácticas que evitan desperdiciar rastreo:

  • Incluye solo páginas indexables, que devuelven un estado 200.
  • Usa siempre la URL canónica, nunca versiones duplicadas del mismo contenido.
  • Mantén el <lastmod> honesto, actualizando la fecha solo cuando el contenido cambia de verdad.
  • Codifica el archivo en UTF-8 y usa URLs absolutas.
Ilustración de un sitemap grande dividido en un índice de sitemaps que apunta a varios archivos más pequeños.

Cómo enviar el sitemap a Google

Después de publicar el archivo, es hora de avisar al buscador. Hay dos formas complementarias:

  • Google Search Console: en el informe de Sitemaps de Google Search Console, basta con indicar la ruta del archivo (por ejemplo, sitemap.xml) y enviarlo. Ahí también sigues los errores y el número de URLs descubiertas.
  • El archivo robots.txt: incluir la línea que apunta al sitemap en robots.txt ayuda a otros buscadores a encontrarlo de forma automática.

Enviarlo por Search Console es el paso más valioso, porque abre un canal de diagnóstico: si alguna URL del sitemap tiene un problema, el informe lo muestra, y puedes confirmarlo caso por caso con la inspección de URL.

Errores comunes en el sitemap XML

Un sitemap descuidado estorba en lugar de ayudar. Los descuidos más frecuentes son:

  • Listar URLs con noindex: pedir al buscador que descubra páginas que tú mismo pides no indexar genera señales contradictorias.
  • Incluir redirecciones y errores: las URLs que devuelven 301, 404 o 410 en el sitemap desperdician rastreo y ensucian los informes.
  • Bloquear el sitemap en robots.txt: si el rastreador no puede leer el archivo, no sirve para nada.
  • Dejar el archivo desactualizado: un sitemap que no refleja el sitio actual pierde su utilidad y puede confundir al buscador.

La corrección pasa por mantener el archivo limpio y sincronizado con el sitio. Un buen sitemap lista solo lo que debe posicionar, siempre en la versión canónica y con un estado saludable.

Preguntas frecuentes

Preguntas frecuentes

Qué es el sitemap XML de un sitio?

Es un archivo en formato XML que lista las URLs importantes del sitio para los buscadores. Ayuda a Google a descubrir y priorizar páginas, pero no obliga a la indexación: funciona como un mapa, no como una garantía.

Cuál es la diferencia entre sitemap XML y robots.txt?

El sitemap XML le dice al buscador qué páginas existen y deben encontrarse. El robots.txt hace lo contrario: orienta lo que los rastreadores pueden o no acceder. Uno invita al descubrimiento, el otro define permisos de rastreo.

Todos los sitios necesitan un sitemap XML?

No es obligatorio, pero casi siempre ayuda. Los sitios pequeños y bien enlazados pueden rastrearse sin él, pero los sitios grandes, nuevos o con páginas aisladas se benefician bastante de tener un sitemap enviado a Google.

Cómo crear un sitemap XML en WordPress?

La forma más simple es usar un plugin de SEO, que genera y actualiza el archivo de forma automática con cada nuevo contenido. Después, basta con enviar la ruta del sitemap en Google Search Console para que el buscador empiece a seguirlo.

Dónde está el sitemap XML?

Suele estar en la raíz del dominio, en direcciones como /sitemap.xml o /sitemap_index.xml. Si no conoces la ruta, revisa el robots.txt del sitio, que muchas veces apunta a la ubicación del archivo.

Un blog que nace listo para Google

Automarticles crea y publica los artículos de tu blog con sitemap, indexación y SEO técnico cuidados en automático, sin que toques código.

Empezar prueba gratis
Sigue aprendiendo

Conceptos relacionados

Robots.txtRobots.txt es un archivo de texto simple, guardado en la raíz del dominio, que indica a los rastreadores de los buscadores qué partes de un sitio pueden o no rastrear. Sigue el Protocolo de Exclusión de Robots y controla el rastreo, no la indexación, por lo que no es la herramienta adecuada para ocultar una página de los resultados de búsqueda.IndexaciónLa indexación es el proceso por el que el buscador añade una página a su índice, la enorme base de datos que consulta para responder a las búsquedas. Tras rastrear y analizar el contenido, Google decide si almacena la página en el índice, y solo lo que está indexado puede aparecer en los resultados. En SEO, garantizar la indexación es el paso obligatorio antes de cualquier intento de posicionar: una página fuera del índice es, en la práctica, invisible para quien busca.Google Search ConsoleGoogle Search Console (GSC) es una herramienta gratuita de Google que muestra cómo el buscador ve tu sitio. En ella sigues qué páginas están indexadas, cuántos clics e impresiones recibe cada contenido en la búsqueda, en qué palabras clave apareces y qué problemas técnicos pueden estar perjudicando tu rendimiento en los resultados orgánicos.CrawlerUn crawler es un programa robot que recorre la web de enlace en enlace, descargando y leyendo páginas para alimentar el índice de un buscador. También llamado spider, robot o bot, el ejemplo más conocido es Googlebot. El crawler es la primera etapa de la búsqueda: antes de que una página pueda ser indexada y posicionada, tiene que ser encontrada y leída por uno de estos rastreadores.