Les sitemaps vous semblent probablement très familiers, car il s'agit généralement du lien que vous trouvez dans le pied de page de tout site Web, n'est-ce pas ? Cependant, ce n'est pas le seul sitemap que vous devez connaître. Il en existe un autre qui répertorie toutes les pages de votre site Web et qui n'est accessible qu'aux webmasters. Comme les sitemaps XML sont assez techniques, nous allons étudier ce sujet en détail.
Que sont les Sitemaps XML ?
Un Sitemap XML est un fichier XML qui répertorie toutes les URL d'un site Web. Vous le téléchargerez dans la Search Console pour envoyer les URL à Google et suivre leur indexation - c'est aussi simple que cela. Chaque URL est accompagnée de paramètres qui indiquent aux moteurs de recherche comment interagir avec chaque page.
Regardons un exemple de Sitemap XML par sitemaps.org en utilisant plusieurs paramètres ; nous les analyserons ensuite.
<?xml version="1.0" encoding="UTF-8"
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=12&desc=vacation_hawaii</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=73&desc=vacation_porto</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=74&desc=vacation_paris</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
</urlset>
Outre la liste des URLs, vous pouvez voir ces autres éléments, qui peuvent être pertinents pour votre stratégie de référencement :
- Priorité: elle indique à Google quelles sont les pages les plus importantes lors de l'exploration d'un site. Google n'en tiendra pas toujours compte, mais c'est essentiel pour présenter un site plus structuré. La plupart du temps, les moteurs de recherche se contentent de vérifier le fichier robots.txt et poursuivent l'exploration du site. Cette valeur va de 0,0 à 1, 1 étant la page la plus cruciale : votre page d'accueil. Cela n'a aucune influence sur les classements.
- Changefreq: indique aux moteurs de recherche combien de fois cette page est destinée à changer, de sorte que le robot Google devrait venir visiter une page plus souvent que les autres (suivant la fréquence indiquée).
- Lastmod : logiquement, c'est quand la page a été modifiée pour la dernière fois. Mais Google n'accordera pas autant d'attention à cette question à moins que ce ne soit pour un journal numérique ou quelque chose où les dernières nouvelles auront un plus grand impact.
Ces paramètres sont facultatifs, mais n'oubliez pas que vous devez toujours inclure l'urlset pour encapsuler le fichier, la balise url pour introduire le bloc d'information d'une URL, et un lieu pour saisir l'URL réelle.
Maintenant vous savez que le plan du site XML n'a rien à voir avec celui du pied de page qui liste certains liens, n'est-ce pas ? Celui-ci s'appelle un Sitemap HTML.
Quelle est la limite d'URL d'un Sitemap XML ?
Un fichier XML ne peut peser que 10 mégaoctets, avec une limite de 50 000 URL par Sitemap XML. Si vous travaillez avec des sites Web volumineux, vous devrez les diviser en plusieurs fichiers, qui peuvent également être divisés par catégorie afin de mieux organiser vos pages Web. Il est bon de les avoir séparées, donc cette limitation d'URL est en fait une bonne excuse pour organiser vos ensembles de pages.
Mais pourquoi est-il bon de séparer les pages en ensembles ? Grâce aux Sitemaps XML segmentés, vous pouvez repérer facilement les problèmes d'indexabilité dans Google Search Console. Si vous constatez qu'une catégorie perd des pages indexées, vous serez en mesure de repérer le problème plus facilement dans une section plus petite que lorsque vous constatez une baisse globale, et vous ne pouvez pas vraiment trouver quelles pages sont affectées en regardant l'ensemble du tableau.
De même, supposons que vous analysiez les sites Web par catégorie. Dans ce cas, il est plus facile de repérer les tendances, de sorte que vous puissiez identifier la stratégie ou la technologie qui affecte ce groupe et l'appliquer aux autres pages.
Vous trouverez d'autres conseils de référencement sur la façon d'optimiser votre sitemap XML dans notre article de blog.
Quand avez-vous besoin d'un plan du site XML Index ?
Donc, sur la base de ce que nous avons mentionné ci-dessus, lorsque vous avez un grand site Web qui a besoin de plusieurs sitemaps parce qu'il ya plus de 50.000 URL, vous aurez besoin de télécharger un index sitemap aussi bien. Voici un exemple d'Index XML Sitemap pour deux sitemaps.
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
Quels sites Web ont besoin d'un Sitemap XML ?
En principe, tout site Web doit avoir au moins un Sitemap XML : du plus petit au plus grand, surtout le dernier. Cela permet de garder une trace du nombre de pages que compte un site Web, et de comparer ce nombre d'URL à celles qui sont réellement indexées !
Il existe d'autres types de sitemaps où vous pouvez indexer des images ou des vidéos.
Quelles pages doivent se trouver dans votre Sitemap XML ?
Nous n'arrêtons pas de dire que vous devez lister toutes vos URLs dans le fichier XML, mais cela suppose que ces pages sont réellement pertinentes pour votre stratégie. Avant de lister n'importe quelle URL, vous voudrez lancer un site Web avec FandangoSEO pour identifier les pages qui renvoient un code de réponse HTTP 200 (ce qui signifie qu'elles sont OK).
Évitez d'énumérer les pages qui renvoient 404 pages introuvables ou Redirige 301 ou 302, car cela risque de semer la confusion dans les moteurs de recherche et, vous savez, personne ne veut le faire.
Comment faire pour que Google trouve un Sitemap XML ?
Une fois que vous avez créé le ou les fichiers, vous pouvez télécharger le plan du site XML sur Google Webmaster Tools pour lancer le suivi de l'indexation et repérer toute baisse ou augmentation importante des pages indexées (avec un peu de chance c'est le deuxième 😉).
Rappelez-vous que la première chose qu'un moteur de recherche fait lorsqu'il trouve un site Web sur Internet est de vérifier le fichier robots.txt, donc si vous voulez vous assurer que votre sitemap est facilement trouvé, il y a la possibilité d'ajouter l'URL du sitemap également.
Générer des Sitemaps XML
Il y a beaucoup d'informations dans cet article, et tout cela semble assez accablant ; nous le savons. C'est pour cette raison que FandangoSEO a créé un système facile à utiliser. Générateur de sitemaps XML sur le cloud, qui les génère automatiquement, et en quelques clics seulement, ils sont prêts à être téléchargés ! Oh, et ne vous inquiétez pas de la limitation à 50.000 URLs - une fois que ce nombre de pages est atteint, il passera à un autre fichier XML, et vous aurez le site web entier listé correctement en un clin d'œil !