Savoir comment utiliser correctement la balise canonique est essentiel pour le référencement. Nous vous expliquons ici tout ce que vous devez savoir sur cette balise et comment l'utiliser pour améliorer vos performances web.
Qu'est-ce qu'un canonical ?
Une balise canonical est un élément HTML qui indique à Google ou à d'autres moteurs de recherche qu'une page spécifique doit être vue avant une autre qui a exactement le même contenu. En utilisant cette balise, vous cacherez automatiquement les autres pages aux moteurs de recherche, mais vous les garderez quand même visibles pour les visiteurs.
Mais pourquoi devons-nous faire cela ? Eh bien, l'une des meilleures pratiques de référencement pour tout site web qui veut améliorer son classement est... d'éviter les doublons! Ainsi, en indiquant à Google la page à consulter, nous l'empêcherons de pénaliser notre site pour avoir du contenu en double. Cela semble logique, non ?
Ceci étant dit, en tant qu'experts SEO, nous voulons d'abord trouver et suivre toutes les pages dupliquées qui ont besoin d'implémenter cette rel=canonique sur leur en-tête HTML. Deuxièmement, nous devrons nous assurer que notre site n'a pas de canonicalisations erronées, et les corriger (ne vous inquiétez pas, nous allons y arriver). En fin de compte, nous voulons voir une structure claire avec zéro -duplicatas visibles-.
Qu'est-ce qu'une balise canonique en SEO ?
Comme nous l'avons déjà mentionné, un canonical est une balise que nous plaçons sur l'en-tête HTML de chacune des pages dupliquées, qui indique aux moteurs de recherche à laquelle des pages dupliquées ils doivent prêter attention. Mais pourquoi les canonicals sont-ils importants pour le référencement ? Tout optimiseur de moteur de recherche se soucie de la façon dont Google explore et indexe ses pages, c'est pourquoi nous effectuons constamment des audits de sites web, pour détecter les problèmes et les résoudre.
Les sites Web doivent offrir un contenu de qualité et original. Les moteurs de recherche comprennent que les sites qui ont un contenu dupliqué ne fournissent pas d'informations pertinentes à leurs visiteurs et ne les classent donc pas en tête de liste.
Les doublons de contenu surviennent régulièrement pour de multiples raisons, par exemple :
- URL erronées = www non-www www
- Trail slashes = mypage.com/home Vs. mypage.com/home /
- Pages sécurisées = https Vs. http
Comme il s'agit d'un problème majeur, nous voulons éviter de générer ce type de pages et corriger autant de pages existantes que possible, en leur ajoutant une balise canonique. Parfois, il est impossible de les éviter, aussi les balises canoniques doivent-elles être mises en œuvre dès le premier jour.
Voyons quelques utilisations canoniques :
Exemple 1 : Vous exécutez un site de commerce électronique C2C et trois utilisateurs différents vendent un iPad Mini 16 Go, donc ils vont très probablement copier la description d'un site existant. Donc, pour éviter de dupliquer le contenu, nous devrons prioriser l'un d'entre eux.
Exemple 2 : Lorsqu'il y a une pagination pour la même catégorie et que vous ne voulez pas que les numéros 2, 3, 4, etc. soient indexés. Vous devrez appliquer un canonical pour diriger les moteurs de recherche vers la page principale (voir comment appliquer le code ci-dessous).
Exemple 3 : Vous vendez des chaussures et vous avez une paire de bottes en cuir très cool. Le problème ici est que vous voulez les placer dans la catégorie "bottes" et dans la catégorie "cuir", mais c'est sur la même page, deux fois. Vous devrez donc indiquer à Google laquelle est la plus importante.
Qu'est-ce que la canonisation ? Pourquoi est-elle importante ?
Mais comment les spécialistes SEO choisissent-ils l'URL canonique principale ? La canonicalisation est le processus qui consiste à choisir l'URL qui sera priorisée. Chaque spécialiste SEO a sa propre stratégie, mais en général, nous examinerons les visites, la structure (en donnant la priorité aux pages les plus proches de la maison), le nombre de liens entrants, l'autorité, etc.
Méfiez-vous des liens canoniques qui ne correspondent pas, car ils peuvent provoquer une boucle canonique, ce qui signifie que votre site va perturber le robot Google. Assurez-vous toujours que vos liens canoniques sont bien implémentés, qu'ils pointent vers des pages existantes et qu'ils ont un code d'état 200 (évitez les codes de redirection).
Pour assurer une mise en œuvre correcte, vous devrez analyser votre site web avec un SEO Crawler. FandangoSEO peut être un excellent allié pour ce faire. Avec notre outil, vous serez en mesure d'identifier tous vos canoniques et de voir s'il y a des pages dupliquées qui n'en ont pas ou si elles pointent vers une mauvaise URL. La plateforme vous aidera à corriger les problèmes en utilisant les instructions in-app ! 🙂 .
A quoi ressemble une balise canonique
Voici un exemple de ce à quoi ressemble la balise canonique dans le code HTML d'une page Web. Vous les trouverez toujours dans la section
section.Exemple :
<link rel=“canonical” href=“https://fandangoseo.com/example-page/” />
Explication :
Ces étiquettes peuvent être auto-référencées lorsqu'une étiquette canonique pointe vers l'URL propre d'une page ou peut faire référence à l'URL d'une autre page.
L'URL contenue dans l'exemple (https://fandangoseo.com/example-page ) indique qu'il s'agit de la version originale ou de la page parentale. En d'autres termes, toute page contenant cette balise canonique dans son code HTML ne sera pas indexée, car Google indexera l'URL canonique à la place. Ou du moins, le géant de la recherche saura que c'est votre préférence car, dans certaines occasions, notamment si Google pense qu'une autre page a plus de valeur, il peut passer outre votre suggestion et indexer l'autre page.
Comment utiliser les balises canoniques
Maintenant, abordons le sujet avec une approche plus technique. Nous avons parlé des balises et des URL, mais... comment les utiliser concrètement ?
Facile. Tapez l'URL préférée dans cette balise :
<link rel=”canonical” href=”http://www.original-URL.com/”/>
IMPORTANT : Vous devez coller ce même code dans les trois pages, dans l'en-tête HTML.
Bonnes pratiques pour les étiquettes canoniques
Suivez ces conseils lorsque vous pointez la version canonique d'une page :
Mettre en place une balise canonique unique pour chaque page
Si une page contient plusieurs balises canoniques, le moteur de recherche les ignorera toutes. Veillez à n'attribuer qu'une seule rel=canonical à la page que vous considérez comme la source d'information privilégiée.
Utiliser des URL en minuscules
Le moteur de recherche peut traiter les URL en majuscules et en minuscules comme deux URL différents. Veillez donc à forcer les URL en minuscules sur le serveur, puis à utiliser les URL en minuscules pour les balises canoniques.
Choisissez la bonne version du domaine
Une fois que vous passez au protocole SSL, il est important de ne pas inclure d'URL non HTTPS dans les balises canoniques, car cela peut créer une confusion et entraîner des résultats inattendus.
Utilise des URL absolues
Il n'est pas conseillé d'utiliser des itinéraires alternatifs avec l'élément de liaison rel= "canonical".
Vous devez utiliser la structure suivante :
<link rel=canonical “href=”https://example.com/sample-page/”/>
Au lieu de celui-ci :
<link rel=“canonical” href=”/ sample-page/”/>
Utiliser des balises canoniques auto-référencées
Nous recommandons l'utilisation de balises canoniques auto-référentielles, bien que ce ne soit pas obligatoire. Elles permettent de préciser la page que vous souhaitez index er ou l'URL à utiliser lors de l'indexation.
Une URL canonique autoréférentielle est une balise canonique sur une page qui pointe vers elle-même. La plupart des CMS modernes ajoutent automatiquement des URL autoréférentielles, mais elles doivent être codées par un développeur si vous utilisez un CMS personnalisé.
Comment mettre en œuvre les balises canoniques
Ensuite, nous allons voir quelles sont les principales façons de mettre en œuvre les balises canoniques:
Utilisation des balises HTML rel = "canonical
The easiest way to point to a canonical URL is the rel=canonical tag. The only thing to do is to add the following code to the <head> section of the duplicate page:
<link rel=”canonical” href=”https://example.com/canonical-page/”/>
Placement dans les en-têtes HTTP
For example, in the case of PDF documents, there is no possibility of placing canonical tags in the page header because there is no page <head> section. In this case, you must use HTTP headers to set the canonical ones.
Par des liens internes
En fonction de la façon dont vous liez vos pages, vous donnez également des informations sur la page canonique qui est la vôtre. Plus votre lien interne est cohérent, plus il sera facile pour le moteur de recherche de déterminer l'URL canonique. Par ailleurs, Google considère que le HTTPS est préférable au HTTP.
Par conséquent, il devrait y avoir une cohérence entre les balises canoniques mises en œuvre et les liens internes. Dans le cas contraire, Google pourrait ignorer votre suggestion de page canonique et en sélectionner une autre à la place.
A travers les plans du site
Les pages non canoniques ne doivent pas apparaître sur les plans de site. Google l'a déclaré, les sitemaps ne doivent donc contenir que les URL canoniques. Cela ne signifie pas que les URL des sitemaps sont garanties comme étant canoniques, mais c'est un moyen facile de définir les URL canoniques sur un grand site.
Avec des redirections 301
Vous devez utiliser les redirections 301 pour détourner le trafic d'une URL dupliquée vers sa version canonique.
Comment éviter les erreurs courantes de canonicalisation
La canonisation est une question complexe, de sorte que des erreurs peuvent se produire fréquemment. Voyons les principales et comment les éviter:
Bloquer l'URL canonique avec robots.txt
Évitez de bloquer les URL canoniques via des fichiers robots.txt , car Google n'explorera pas la page. Vérifiez les directives que vous donnez sur le fichier robots.txt pour éviter les problèmes canoniques.
Définir l'URL canonique comme "noindex".
Ne jamais mélanger "noindex" et rel = canonique car ce sont des instructions qui se contredisent.
Google donnera la priorité à la balise canonique sur le "noindex", mais ce n'est pas une bonne pratique. Pour éviter l'indexation ou pour rendre une page canonique, vous devez utiliser la redirection 301 . Sinon, il est préférable d'utiliser la balise rel=canonical.
Définition d'un code de statut HTTP 4XX dans l'URL canonique
Il est essentiel d'éviter le code d'état HTTP 4XX pour une URL canonique car il aura le même effet que la balise "noindex". En d'autres termes, Google ne verra pas la balise canonical et ne transférera pas la valeur du lien à la version canonical.
Canonisation de toutes les pages vers la page racine
Ne pas canoniser les pages paginées à la première page paginée de la série. Cependant, vous devez utiliser des canoniques auto-référencées sur toutes les pages paginées.
N'utilisez pas de balises canoniques avec hreflang
Google a averti que lorsque vous utilisez hreflang, vous devez spécifier une page canonique dans la même langue ou la meilleure langue de substitution possible si aucune page canonique n'existe pour la même langue.
Having a rel = canonical on the <body>
The rel = canonical should only appear in the <head> of the document. If there is a canonical tag in the <body> section of a page, search engines will ignore it. This can also be confusing when they crawl a document.
Texte alternatif Rubriques