Canonique

Savoir comment utiliser correctement la balise canonique est essentiel pour le référencement. Nous vous expliquons ici tout ce que vous devez savoir sur cette balise et comment l'utiliser pour améliorer vos performances web.

Qu'est-ce qu'un canonical ?

Une balise canonical est un élément HTML qui indique à Google ou à d'autres moteurs de recherche qu'une page spécifique doit être vue avant une autre qui a exactement le même contenu. En utilisant cette balise, vous cacherez automatiquement les autres pages aux moteurs de recherche, mais vous les garderez quand même visibles pour les visiteurs.

Mais pourquoi devons-nous faire cela ? Eh bien, l'une des meilleures pratiques de référencement pour tout site web qui veut améliorer son classement est... d'éviter les doublons! Ainsi, en indiquant à Google la page à consulter, nous l'empêcherons de pénaliser notre site pour avoir du contenu en double. Cela semble logique, non ?

Ceci étant dit, en tant qu'experts SEO, nous voulons d'abord trouver et suivre toutes les pages dupliquées qui ont besoin d'implémenter cette rel=canonique sur leur en-tête HTML. Deuxièmement, nous devrons nous assurer que notre site n'a pas de canonicalisations erronées, et les corriger (ne vous inquiétez pas, nous allons y arriver). En fin de compte, nous voulons voir une structure claire avec zéro -duplicatas visibles-.

 

Qu'est-ce qu'une balise canonique en SEO ?

Comme nous l'avons déjà mentionné, un canonical est une balise que nous plaçons sur l'en-tête HTML de chacune des pages dupliquées, qui indique aux moteurs de recherche à laquelle des pages dupliquées ils doivent prêter attention. Mais pourquoi les canonicals sont-ils importants pour le référencement ? Tout optimiseur de moteur de recherche se soucie de la façon dont Google explore et indexe ses pages, c'est pourquoi nous effectuons constamment des audits de sites web, pour détecter les problèmes et les résoudre.

Les sites Web doivent offrir un contenu de qualité et original. Les moteurs de recherche comprennent que les sites qui ont un contenu dupliqué ne fournissent pas d'informations pertinentes à leurs visiteurs et ne les classent donc pas en tête de liste.

Les doublons de contenu surviennent régulièrement pour de multiples raisons, par exemple :

  • URL erronées = www non-www www
  • Trail slashes = mypage.com/home Vs. mypage.com/home /
  • Pages sécurisées = https Vs. http

Comme il s'agit d'un problème majeur, nous voulons éviter de générer ce type de pages et corriger autant de pages existantes que possible, en leur ajoutant une balise canonical. Parfois, il est impossible de les éviter, c'est pourquoi les canoniques devront être mises en œuvre dès le premier jour.

Voyons quelques utilisations canoniques :

Exemple 1 : Vous exécutez un site de commerce électronique C2C et trois utilisateurs différents vendent un iPad Mini 16 Go, donc ils vont très probablement copier la description d'un site existant. Donc, pour éviter de dupliquer le contenu, nous devrons prioriser l'un d'entre eux.

Exemple 2 : Lorsqu'il y a pagination pour la même catégorie et que vous ne voulez pas que le numéro 2, 3, 4, etc. soit indexé. Vous devrez appliquer un canonique pour diriger les moteurs de recherche vers la page principale (voir comment appliquer le code ci-dessous.)

Exemple 3 : Vous vendez des chaussures et vous avez une paire de bottes en cuir cool. Le problème ici est que vous voudrez les placer dans la catégorie "bottes" et dans la catégorie "cuir" ; mais c'est la même page, deux fois. Vous devrez donc dire à Google lequel est le plus important.

 

Qu'est-ce que la canonisation ?

Mais comment les spécialistes SEO choisissent-ils l'URL canonique principale ? La canonicalisation est le processus qui consiste à choisir l'URL qui sera priorisée. Chaque spécialiste SEO a sa propre stratégie, mais en général, nous examinerons les visites, la structure (en donnant la priorité aux pages les plus proches de la maison), le nombre de liens entrants, l'autorité, etc.

Méfiez-vous des canoniques qui ne correspondent pas parce qu'ils peuvent provoquer une boucle canonique, ce qui signifie que votre site va confondre le bot Google. Assurez-vous toujours que vos canoniques sont bien implémentés, qu'ils pointent vers des pages existantes, et qu'ils ont un code d'état 200 (en évitant tout code de redirection).

Pour assurer une implémentation correcte, vous devrez analyser votre site web avec un SEO Crawler. FandangoSEO peut être un grand allié pour ce faire. Avec notre outil, vous pourrez identifier tous vos canoniques, voir s'il y a des pages en double qui n'en ont pas ou si elles pointent vers une mauvaise URL. La plate-forme vous aidera à résoudre tous les problèmes en utilisant les instructions de l'application ! 🙂

 

Comment utiliser les balises canoniques

Passons maintenant au sujet avec une approche plus technique. Nous avons parlé de balises et d'URL, mais... à quoi cela ressemble-t-il vraiment ?

Facile. Tapez l'URL préférée dans cette balise :

<link rel=”canonical” href=”http://www.original-URL.com/”/>

balises canoniques
IMPORTANT : Vous devez coller ce même code dans les trois pages, dans l'en-tête HTML.

Bonnes pratiques pour les étiquettes canoniques

Suivez ces conseils lorsque vous pointez la version canonique d'une page :

Implémente une seule balise canonique pour chaque page

Si une page contient plusieurs balises canoniques, le moteur de recherche les ignorera toutes. Veillez à n'attribuer qu'une seule balise rel=canonical à la page que vous considérez comme la source d'information préférée.

Utiliser des URL en minuscules

Le moteur de recherche peut traiter les URL en majuscules et en minuscules comme deux URL différents. Veillez donc à forcer les URL en minuscules sur le serveur, puis à utiliser les URL en minuscules pour les balises canoniques.

Choisissez la bonne version du domaine

Une fois que vous passez au protocole SSL, il est important de ne pas inclure d'URL non HTTPS dans les balises canoniques, car cela peut créer une confusion et entraîner des résultats inattendus.

Utilise des URL absolues

Il n'est pas conseillé d'utiliser des itinéraires alternatifs avec l'élément de liaison rel= "canonical".

Vous devez utiliser la structure suivante :

<link rel=canonical “href=”https://example.com/sample-page/”/>

Au lieu de celui-ci :

<link rel=“canonical” href=”/ sample-page/”/>

Utiliser des balises canoniques auto-référencées

Nous recommandons l'utilisation de balises canoniques auto-référentielles, bien que ce ne soit pas obligatoire. Elles permettent de préciser la page que vous souhaitez index er ou l'URL à utiliser lors de l'indexation.

Un canonique auto-référentiel est une balise canonique sur une page qui pointe vers elle-même. La plupart des CMS modernes ajoutent automatiquement des URL auto-référentielles, mais elles doivent être codées par un développeur si vous utilisez un CMS personnalisé.

 

Comment mettre en œuvre les balises canoniques

Ensuite, nous allons voir ce que le principaux moyens de mettre en œuvre les balises canoniques sont :
HTML

Utilisation des balises HTML rel = "canonical

The easiest way to point to a canonical URL is the rel=canonical tag. The only thing to do is to add the following code to the <head> section of the duplicate page:

<link rel=”canonical” href=”https://example.com/canonical-page/”/>

Placement dans les en-têtes HTTP

For example, in the case of PDF documents, there is no possibility of placing canonical tags in the page header because there is no page <head> section. In this case, you must use HTTP headers to set the canonical ones.

Par des liens internes

En fonction de la façon dont vous liez vos pages, vous donnez également des informations sur la page canonique qui est la vôtre. Plus votre lien interne est cohérent, plus il sera facile pour le moteur de recherche de déterminer l'URL canonique. Par ailleurs, Google considère que le HTTPS est préférable au HTTP.

Par conséquent, il devrait y avoir une cohérence entre les balises canoniques mises en œuvre et les liens internes. Dans le cas contraire, Google pourrait ignorer votre suggestion de page canonique et en sélectionner une autre à la place.

A travers les plans du site

Les pages non canoniques ne doivent pas apparaître sur les plans de site. Google l'a déclaré, les sitemaps ne doivent donc contenir que les URL canoniques. Cela ne signifie pas que les URL des sitemaps sont garanties comme étant canoniques, mais c'est un moyen facile de définir les URL canoniques sur un grand site.

Avec des redirections 301

Vous devez utiliser les redirections 301 pour détourner le trafic d'une URL dupliquée vers sa version canonique.

 

Comment éviter les erreurs courantes de canonicalisation

La canonisation est une question complexe, de sorte que des erreurs peuvent se produire fréquemment. Voyons les principales et comment les éviter:

Bloquer l'URL canonique avec robots.txt

Évitez de bloquer les URL canoniques via des fichiers robots.txt , car Google n'explorera pas la page. Vérifiez les directives que vous donnez sur le fichier robots.txt pour éviter les problèmes canoniques.

Définir l'URL canonique comme "noindex".

Ne jamais mélanger "noindex" et rel = canonique car ce sont des instructions qui se contredisent.

Google donnera la priorité à la balise canonique sur le "noindex", mais ce n'est pas une bonne pratique. Pour éviter l'indexation ou pour rendre une page canonique, vous devez utiliser la redirection 301 . Sinon, il est préférable d'utiliser la balise rel=canonical.

Définition d'un code de statut HTTP 4XX dans l'URL canonique

Il est essentiel d'éviter le code d'état HTTP 4XX pour une URL canonique car il aura le même effet que la balise "noindex". En d'autres termes, Google ne verra pas la balise canonical et ne transférera pas la valeur du lien à la version canonical.

Canonisation de toutes les pages vers la page racine

Ne pas canoniser les pages paginées à la première page paginée de la série. Cependant, vous devez utiliser des canoniques auto-référencées sur toutes les pages paginées.

N'utilisez pas de balises canoniques avec hreflang

Google a averti que lorsque vous utilisez hreflang, vous devez spécifier une page canonique dans la même langue ou la meilleure langue de substitution possible si aucune page canonique n'existe pour la même langue.

Having a rel = canonical on the <body>

The rel = canonical should only appear in the <head> of the document. If there is a canonical tag in the <body> section of a page, search engines will ignore it. This can also be confusing when they crawl a document.

 

Prêt à lutter contre la duplication de vos contenus ?

Vérifiez les canoniques maintenant

Arrow-up