Los sitemaps probablemente le suenen muy familiares porque suelen ser ese enlace que puede encontrar en el pie de página de cualquier sitio web, ¿verdad? Sin embargo, ese no es el único mapa del sitio que deben conocer. Hay otro que enumera todas las páginas que tienes en tu sitio web, y sólo es accesible para los webmasters. Como los sitemaps XML son bastante técnicos, vamos a investigar este tema en detalle.
Tabla de contenido
¿Qué son los sitemaps XML?
Un sitemap XML es un archivo XML que enumera todas las URL de un sitio web y que se cargará en Search Console para enviar las URL a Google y realizar un seguimiento de su indexación, así de sencillo. Cada URL irá acompañada de parámetros que indican a los motores de búsqueda cómo interactuar con cada una de las páginas.
Veamos un ejemplo de sitemap XML de sitemaps.org utilizando varios parámetros; después, los analizaremos.
<?xml version="1.0" encoding="UTF-8"
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=12&desc=vacation_hawaii</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=73&desc=vacation_porto</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=74&desc=vacation_paris</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
</urlset>
Aparte de la lista de URLs, puede ver estos otros elementos, que pueden ser relevantes para su estrategia SEO:
- Prioridad: indica a Google qué páginas son más importantes cuando rastrea un sitio. Google no siempre lo tendrá en cuenta, pero es esencial para presentar un sitio más estructurado. La mayoría de las veces, los motores de búsqueda sólo comprobarán el robots.txt y seguirán adelante con el rastreo. Este valor oscila entre 0,0 y 1, siendo 1 la página más crucial: su Home. No influye en la clasificación.
- Frecuencia de cambio: indica a los motores de búsqueda cuántas veces se pretende cambiar esta página, por lo que el robot de Google debería visitar una página más a menudo que otras (siguiendo la frecuencia indicada).
- Lastmod: lógicamente, es cuándo se modificó la página por última vez. Pero Google no prestará tanta atención a esto a menos que se trate de un periódico digital o algo así donde las últimas noticias tengan un mayor impacto.
Estos parámetros son opcionales, pero recuerda que siempre tienes que incluir el urlset para encapsular el archivo, la etiqueta url para introducir el bloque de información de una URL y un loc para escribir la URL real.
Ahora ya sabes que el Sitemap XML no tiene nada que ver con el que aparece en el pie de página y que enumera algunos enlaces, ¿verdad? Ese se llama Sitemap HTML.
¿Cuál es el límite de URL en un sitemap XML?
Un archivo XML sólo puede pesar 10 megabytes, con un límite de 50.000 URL por sitemap XML. Si trabaja con sitios web enormes, tendrá que dividirlos en varios archivos, que también pueden dividirse por categorías para mantener sus páginas web más organizadas. Es bueno tenerlas separadas, así que esta limitación de URL es en realidad una buena excusa para organizar tus conjuntos de páginas.
Pero, ¿por qué es bueno separar las páginas en conjuntos? Gracias a los sitemaps XML segmentados, puede detectar fácilmente problemas de indexabilidad en Google Search Console. Si ves que una categoría pierde páginas indexadas, podrás detectar el problema más fácilmente en una sección más pequeña que cuando ves una caída global, y realmente no puedes encontrar a qué páginas está afectando mirando la imagen completa.
Del mismo modo, supongamos que analiza las páginas web por categorías. En ese caso, es más fácil detectar tendencias para poder identificar la estrategia o tecnología que afecta a ese grupo y aplicarla a las demás páginas.
Encontrará más consejos SEO sobre cómo optimizar su mapa del sitio XML en nuestra entrada de blog.
¿Cuándo se necesita un índice XML?
Así que, basándonos en lo que hemos mencionado anteriormente, cuando tengas un sitio web grande que necesite múltiples sitemaps porque hay más de 50.000 URLs, necesitarás subir también un índice de sitemap. He aquí un ejemplo de mapa del sitio de índice XML para dos mapas del sitio.
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
¿Qué sitios web necesitan un sitemap XML?
Básicamente, cualquier sitio web debe tener al menos un sitemap XML: desde el más pequeño al más grande, especialmente este último. Ayuda a llevar la cuenta de cuántas páginas forman un sitio web, ¡y se puede comparar este número de URL con las que realmente se indexan!
Existen otros tipos de sitemaps en los que se pueden indexar imágenes o vídeos.
¿Qué páginas debe incluir su sitemap XML?
Seguimos diciendo que tiene que listar todas sus URLs en el archivo XML, pero esto es asumiendo que esas páginas son realmente relevantes para su estrategia. Antes de listar cualquier URL, querrás ejecutar un rastreo del sitio web con FandangoSEO para identificar las páginas que devuelven un código de respuesta HTTP 200 (lo que significa que están bien).
Evite listar páginas que devuelvan 404 páginas no encontradas o redirecciones 301 o 302, porque eso confundirá a los motores de búsqueda y, ya sabe, nadie quiere hacer eso.
¿Cómo hacer que Google encuentre un sitemap XML?
Una vez que hayas creado el archivo o los archivos, puedes subir el sitemap XML a las Herramientas para webmasters de Google para poner en marcha el seguimiento de la indexación y detectar cualquier caída o aumento importante de las páginas indexadas (esperemos que sea lo segundo 😉 )
Recuerde que lo primero que hace un motor de búsqueda cuando encuentra un sitio web en Internet es comprobar el archivo robots.txt, así que si quiere asegurarse de que su mapa del sitio se encuentra fácilmente, también tiene la opción de añadir allí la URL del mapa del sitio.
Generar sitemaps XML
Hay mucha información en este artículo, y todo suena bastante abrumador; lo sabemos. Por eso FandangoSEO ha creado un sencillo generador de sitemaps XML en la nube, que los genera automáticamente, y en unos pocos clics, ¡están listos para ser subidos! Ah, y no te preocupes por la limitación de 50.000 URLs - una vez alcanzado este número de páginas, saltará a otro archivo XML, ¡y tendrás todo el sitio web listado correctamente en un abrir y cerrar de ojos!