Un sitemap XML con errores es peor que no tener sitemap: Google recibe señales contradictorias y desconfía de tu site. Antes de subirlo a Search Console, valídalo. Solo 3 minutos con herramientas gratuitas detectan el 95 % de problemas: URLs 404, redirects, bloqueo por robots.txt, codificación rota, estructura XML mal. Es uno de los chequeos básicos del SEO técnico de cualquier web. Aquí te enseño cómo validar bien, qué errores detectar y cómo arreglar los más comunes.
Dos niveles: (1) validación de sintaxis XML (que el archivo esté bien formado y cumpla el estándar de sitemaps.org) y (2) validación de contenido (que las URLs listadas sean válidas, accesibles e indexables). Ambas son necesarias.
Herramientas gratuitas para validar
1. Validadores XML online
Los más usados:
- sitemap.webmasters.bg/validator — verifica estructura XML básica.
- xmlvalidation.com — valida cualquier XML contra estándar del sitemap.
- xml-sitemaps.com/validate-xml-sitemap.html — chequeo completo incluyendo URLs.
Uso: pegas la URL de tu sitemap (tudominio.com/sitemap.xml) y el validador te da informe detallado de errores.
2. Google Search Console
La validación más importante. Una vez enviado tu sitemap en Search Console → Sitemaps, Google lo procesa y muestra:
- Estado: Correcto / Con errores / Incompleto.
- Nº URLs descubiertas.
- Nº URLs indexadas de ese sitemap (las que ya pueden aparecer en Google).
- Errores específicos con URL afectada y motivo (404, bloqueada por robots, etiqueta canónica distinta, etc.).
3. Screaming Frog
Herramienta desktop (gratuita hasta 500 URLs). Crawl del sitemap para verificar cada URL: código HTTP, redirects, canonical, meta robots. Esencial para sites medianos-grandes.
Los 8 errores más comunes al validar
1. URLs con código 404
URL listada en sitemap pero que devuelve página no encontrada. Causa: borraste la página sin regenerar sitemap, o cambiaste slug sin actualizar. Fix: regenerar sitemap (plugin SEO lo hace solo) o eliminar esas URLs manualmente.
2. URLs con redirect 301/302
El sitemap debe contener URLs canónicas finales, no URLs que redirigen. Fix: actualizar sitemap con la URL final tras el redirect.
3. URLs bloqueadas en robots.txt
Contradicción: el sitemap las propone pero robots.txt las bloquea. Fix: decidir — o las quitas del sitemap o las permites en robots.txt.
4. URLs con meta noindex
Otra contradicción. Google las ignorará. Fix: quitar noindex o excluirlas del sitemap.
5. URLs con canonical apuntando a otra URL
Si la URL A tiene canonical hacia B, Google indexará B no A. El sitemap debe contener B.
6. Estructura XML mal formada
Error de sintaxis: etiquetas sin cerrar, caracteres especiales no escapados (& en vez de &), codificación distinta a UTF-8.
7. Más de 50.000 URLs o 50 MB
Límite oficial de sitemaps. Solución: dividir en sitemaps hijos + sitemap índice que apunte a los hijos.
8. Fechas lastmod inválidas
Formato incorrecto (debe ser W3C Datetime: YYYY-MM-DD o YYYY-MM-DDTHH:MM:SS+TZ). Fechas futuras también invalidan.
Preguntas frecuentes
Primera vez: al crearlo. Luego, siempre que: hagas migración de URLs, borres contenido masivamente, cambies estructura de categorías, cambies dominio. En condiciones normales, revisar Search Console → Sitemaps mensualmente es suficiente.
Suele ser sintaxis XML. Valida con xmlvalidation.com primero. Si el XML es correcto, podría ser tamaño excesivo o redireccionamientos en cascada. Google da pista del tipo exacto de error en el informe.
Es opcional y Google ya no la usa mucho. Sirve poco. Lo realmente importante: lastmod (fecha modificación) actualizada correctamente. La prioridad déjala por defecto.
Normal al inicio. Google indexa progresivamente y puede descartar URLs que considera de baja calidad o duplicadas. Pasado 3-4 meses, si sigue habiendo diferencia grande, ver en Search Console → Páginas el motivo de las no indexadas. Probablemente hay que mejorar contenido o internal linking, algo en lo que te puede ayudar un consultor SEO.
Sí. El sitemap índice (archivo principal que apunta a sitemaps hijos) tiene estructura XML ligeramente distinta (<sitemapindex> en vez de <urlset>). Los validadores los detectan automáticamente. Si tienes sitemaps separados por tipo de contenido, hay que validar cada hijo además del índice.
Lo siguiente
- 5 minutos: valida tu sitemap con xml-sitemaps.com/validate-xml-sitemap.html.
- 10 minutos: revisa Search Console → Sitemaps. Si hay errores, mira el listado y corrige los más frecuentes.
- Mensualmente: revisión rápida de Sitemaps en Search Console. La mayoría de meses no habrá nada nuevo.





