Un sitemap XML con errores es peor que no tener sitemap: Google recibe señales contradictorias y desconfía de tu site. Antes de subirlo a Search Console, valídalo. Solo 3 minutos con herramientas gratuitas detectan el 95 % de problemas: URLs 404, redirects, bloqueo por robots.txt, codificación rota, estructura XML mal. Aquí te enseño cómo validar bien, qué errores detectar y cómo arreglar los más comunes.
Dos niveles: (1) validación de sintaxis XML (que el archivo esté bien formado y cumpla el estándar de sitemaps.org) y (2) validación de contenido (que las URLs listadas sean válidas, accesibles e indexables). Ambas son necesarias.
Herramientas gratuitas para validar
1. Validadores XML online
Los más usados:
- sitemap.webmasters.bg/validator — verifica estructura XML básica.
- xmlvalidation.com — valida cualquier XML contra estándar del sitemap.
- xml-sitemaps.com/validate-xml-sitemap.html — chequeo completo incluyendo URLs.
Uso: pegas la URL de tu sitemap (tudominio.com/sitemap.xml) y el validador te da informe detallado de errores.
2. Google Search Console
La validación más importante. Una vez enviado tu sitemap en Search Console → Sitemaps, Google lo procesa y muestra:
- Estado: Correcto / Con errores / Incompleto.
- Nº URLs descubiertas.
- Nº URLs indexadas de ese sitemap.
- Errores específicos con URL afectada y motivo (404, bloqueada por robots, etiqueta canónica distinta, etc.).
3. Screaming Frog
Herramienta desktop (gratuita hasta 500 URLs). Crawl del sitemap para verificar cada URL: código HTTP, redirects, canonical, meta robots. Esencial para sites medianos-grandes.
Los 8 errores más comunes al validar
1. URLs con código 404
URL listada en sitemap pero que devuelve página no encontrada. Causa: borraste la página sin regenerar sitemap, o cambiaste slug sin actualizar. Fix: regenerar sitemap (plugin SEO lo hace solo) o eliminar esas URLs manualmente.
2. URLs con redirect 301/302
El sitemap debe contener URLs canónicas finales, no URLs que redirigen. Fix: actualizar sitemap con la URL final tras el redirect.
3. URLs bloqueadas en robots.txt
Contradicción: el sitemap las propone pero robots.txt las bloquea. Fix: decidir — o las quitas del sitemap o las permites en robots.txt.
4. URLs con meta noindex
Otra contradicción. Google las ignorará. Fix: quitar noindex o excluirlas del sitemap.
5. URLs con canonical apuntando a otra URL
Si la URL A tiene canonical hacia B, Google indexará B no A. El sitemap debe contener B.
6. Estructura XML mal formada
Error de sintaxis: etiquetas sin cerrar, caracteres especiales no escapados (& en vez de &), codificación distinta a UTF-8.
7. Más de 50.000 URLs o 50 MB
Límite oficial de sitemaps. Solución: dividir en sitemaps hijos + sitemap índice que apunte a los hijos.
8. Fechas lastmod inválidas
Formato incorrecto (debe ser W3C Datetime: YYYY-MM-DD o YYYY-MM-DDTHH:MM:SS+TZ). Fechas futuras también invalidan.
Preguntas frecuentes
Primera vez: al crearlo. Luego, siempre que: hagas migración de URLs, borres contenido masivamente, cambies estructura de categorías, cambies dominio. En condiciones normales, revisar Search Console → Sitemaps mensualmente es suficiente.
Suele ser sintaxis XML. Valida con xmlvalidation.com primero. Si el XML es correcto, podría ser tamaño excesivo o redireccionamientos en cascada. Google da pista del tipo exacto de error en el informe.
Es opcional y Google ya no la usa mucho. Sirve poco. Lo realmente importante: lastmod (fecha modificación) actualizada correctamente. La prioridad déjala por defecto.
Normal al inicio. Google indexa progresivamente y puede descartar URLs que considera de baja calidad o duplicadas. Pasado 3-4 meses, si sigue habiendo diferencia grande, ver en Search Console → Páginas el motivo de las no indexadas. Probablemente hay que mejorar contenido o internal linking.
Sí. El sitemap índice (archivo principal que apunta a sitemaps hijos) tiene estructura XML ligeramente distinta (<sitemapindex> en vez de <urlset>). Los validadores los detectan automáticamente. Si tienes sitemaps separados por tipo de contenido, hay que validar cada hijo además del índice.
Lo siguiente
- 5 minutos: valida tu sitemap con xml-sitemaps.com/validate-xml-sitemap.html.
- 10 minutos: revisa Search Console → Sitemaps. Si hay errores, mira el listado y corrige los más frecuentes.
- Mensualmente: revisión rápida de Sitemaps en Search Console. La mayoría de meses no habrá nada nuevo.


