Duplication du contenu

Ledouble contenu est un problème dans le référencement, bien que, comme nous le verrons, ce ne soit pas pour la raison que l'on pense habituellement. Nous analysons ce problème pour découvrir quelles sont ses conséquences réelles, et comment les éviter. Suivez nos directives pour vous en débarrasser et éviter de nuire gravement à vos efforts de référencement.

Tout d'abord, commençons par les bases.

 

Qu'est-ce qu'un contenu dupliqué ?

Selon la définition de Google, le contenu dupliqué fait référence à des éléments de contenu au sein d'un domaine ou entre domaines qui correspondent entièrement ou sont remarquablement similaires. Une autre façon d'expliquer cela serait un contenu qui vit dans plusieurs endroits. La question est maintenant de savoir quel type de contenu dupliqué existe et pourquoi il est généré. C'est ce que nous allons aborder ensuite.

contenu dupliqué

Comment définit-on le contenu dupliqué ?

D'après la définition de Google, nous déduisons qu'il existe deux types de contenu dupliqué :

  • Dupliquer le contenu d'un même site web.
  • Duplication de contenu trouvée entre deux domaines différents. Dans ce cas, Google considère le contenu dupliqué comme du contenu gratté (copié).

 

Causes communes des duplications de contenu

Les principales raisons pour lesquelles des contenus dupliqués sont généralement créés sont les suivantes :

 

Créer des URL différentes avec le même contenu

Si nous créons consciemment ou par erreur le même contenu pour différentes URL, nous devons savoir que cela donnera des problèmes de duplication de contenu au moteur de recherche.

 

ID des sessions dans l'URL

Ce problème de double emploi se pose souvent lorsque chaque utilisateur qui arrive à la page se voit attribuer un identifiant qui est stocké dans l'URL. Cela se produit lorsque vous voulez suivre l'utilisateur ou si un panier d'achat est disponible sur le web.

 

Le CMS n'utilise pas d'URL propres

La page principale d'un site web est la page d'accueil, car c'est celle qui contient le plus de liens, tant internes qu'externes. Comme elle comporte un grand nombre de liens internes et externes, il est essentiel de garder l'URL propre. Parfois, des paramètres d'URL pointant vers la page d'accueil sont créés, ce qui génère du contenu en double.

 

Pagination des commentaires

Certains CMS tels que WordPress incluent la possibilité de paginer les commentaires, ce qui entraîne une duplication du contenu si le nombre de commentaires est important.

 

Structure d'URL incohérente / paramètres d'URL utilisés pour le tri et le suivi

Faites attention à ces URL :

www.myweb.com

myweb.com

http://myweb.com

http://myweb.com/

https://www.myweb.com

https://myweb.com

Ils sont les mêmes pour vous, et en fait, ce sont les mêmes URL de destination. Mais les robots des moteurs de recherche ne voient pas les choses de la même façon et les considèrent comme des URL différentes. Ainsi, lorsque les robots trouvent le même contenu dans deux URL, ils le traitent comme un double.

Le même problème se pose également pour le suivi des URL, qui peuvent également être identifiées comme un contenu dupliqué.

C'est la raison pour laquelle vous devez porter une attention particulière à la structure de votre URL.

 

www vs. non-www / http vs. https

C'est un vieux problème, mais il arrive encore que les moteurs de recherche fassent des erreurs lorsqu'un site web est accessible avec ou sans www. Ce qui se produit, bien que dans une moindre mesure, avec HTTP et HTTPS.

 

Utilisation des paramètres dans les sites de commerce électronique

Nous parlons ici de l'ajout de paramètres de recherche, de la pagination, des ID de session, du filtrage ou de la classification aux URL. La page du produit est la même, mais pour le GoogleBot, il y a des URL différentes. Voyons cela avec un exemple :

www.example.com/shop/red-sneakers

www.example.com/shop/red-sneakers?number=37

www.example.com/shop/red-sneakers?number=38

www.example.com/shop/red-sneakers?number=39

Ce problème se pose également lors de la création d'URL à des fins de suivi.

 

Pourquoi le double contenu est-il mauvais pour le référencement ?

La génération de contenus dupliqués est mauvaise pour le référencement pour deux raisons principales :

contenu dupliqué

  •   Si vous générez du contenu en double sur un même site, vous porterez préjudice à votre référencement, mais vous ne serez pas pénalisé par Google. Cela réduit les performances de toutes ces versions, car elles sont en concurrence les unes avec les autres.
  •   De même, les moteurs de recherche ont des problèmes pour consolider les mesures de liens pour ce contenu (autorité de la page, confiance et pertinence), surtout lorsqu'il y a d'autres sites qui renvoient à plusieurs versions de ce contenu.

 

Puis-je recevoir une pénalité de Google pour les contenus dupliqués ?

Si vous générez du contenu en double sur un même site, le référencement sera compromis, mais vous ne serez pas pénalisé par Google. Cela brise un "mythe" car on pense souvent que le moteur de recherche "punit" les sites qui contiennent du contenu en double.

Cependant, le moteur de recherche vous pénalisera si vous extrayez le contenu d'une autre personne. Dans ce cas, et comme nous l'avons déjà souligné, nous parlerions de "contenu copié" plutôt que de contenu dupliqué, car le contenu n'est pas vraiment "dupliqué", mais plutôt plagié.

 

Comment éviter que les contenus dupliqués ne deviennent un problème

Sachant déjà quel est le problème, il y a différentes solutions à appliquer :

  • Assurez-vous que vos URL sont cohérentes et utilisez la console de recherche Google pour indiquer quel est le domaine préféré.
  • Créer un contenu original sur chaque page du site web qui vous intéresse pour apparaître dans les classements.
  • S'il est inévitable de maintenir des pages au contenu très similaire, vous devez utiliser une balise canonical pour la page préférée afin que Google puisse l'identifier.
  • Évitez que les robots fouillent des pages non pertinentes en utilisant la balise meta "noindex".
  • Éliminer les pages qui ne présentent pas d'intérêt et rediriger vers celles qui en présentent. Ce dernier point est fondamental car si vous n'attribuez pas de redirection, les robots peuvent rencontrer l'erreur 404 la prochaine fois qu'ils essaieront de suivre les URL.
  • Établir des redirections 301 des URL non privilégiées vers les URL privilégiées pour alerter le moteur de recherche de vos préférences.
  • Utilisez la console de recherche Google pour supprimer les URL des résultats de recherche et accélérer le processus afin que Google n'indexe pas et n'examine pas ces pages.
Arrow-up