Contenido duplicado

El contenido duplicado es un problema en el SEO, aunque como veremos, no es por la razón que se suele pensar. Analizamos este tema para descubrir cuáles son sus verdaderas consecuencias, y cómo evitarlas. Siga nuestras directrices para deshacerse de él y evitar daños graves a sus esfuerzos de SEO.

Primero, empecemos con lo básico.

 

¿Qué es el contenido duplicado?

Según la definición de Google, el contenido duplicado se refiere a las piezas de contenido dentro o entre dominios que coinciden completamente o son notablemente similares. Otra forma de explicarlo sería el contenido que aparece en varios lugares. Ahora la pregunta es ¿qué tipo de contenido duplicado hay y por qué se genera? Esto es lo que vamos a abordar a continuación.

contenido duplicado

¿Cómo se define el contenido duplicado?

A partir de la definición de Google, podemos deducir que hay dos tipos de contenido duplicado:

  • Contenido duplicado dentro del mismo sitio web.
  • Contenido duplicado encontrado entre dos dominios diferentes. En este caso, Google considera que el contenido duplicado es contenido copiado.

 

Causas comunes del contenido duplicado

Las principales razones por las que se suele crear un contenido duplicado son las siguientes:

 

Crear diferentes URLs con el mismo contenido

Si conscientemente o por error creamos el mismo contenido para diferentes URL, debemos saber que esto dará problemas de contenido duplicado al motor de búsqueda.

 

ID de las sesiones en la URL

Este problema de duplicidad suele surgir cuando a cada usuario que llega a la página se le asigna un ID que se almacena en la URL. Esto sucede cuando se quiere rastrear al usuario o si hay un carrito de compras disponible en la web.

 

El CMS no utiliza URLs limpias

La página principal de un sitio web es la página de inicio, ya que es la que tiene más enlaces, tanto internos como externos. Como tiene tantos enlaces internos y externos, es esencial mantener la URL limpia. A veces se crean parámetros de URL que apuntan a la página principal, generando contenido duplicado.

 

Paginación de comentarios

Algunos CMS como WordPress incluyen la opción de paginar los comentarios, lo que da lugar a un contenido duplicado si el número de comentarios es grande.

 

Estructura inconsistente de la URL / parámetros de la URL utilizados para la clasificación y el seguimiento

Presta atención a estas URLs:

www.myweb.com

myweb.com

http://myweb.com

http://myweb.com/

https://www.myweb.com

https://myweb.com

Son lo mismo para ti, y de hecho, son la misma URL de destino. Pero los robots de los motores de búsqueda no lo ven de la misma manera y los consideran como URLs diferentes. Así que cuando los robots encuentran el mismo contenido en dos URL, lo tratan como un duplicado.

El mismo problema se plantea con los rastreos de URL, que también pueden ser identificados como un contenido duplicado.

Esta es la razón por la que debes prestar especial atención a la estructura de tus URLs.

 

www vs. no-www / http vs. https

Es un viejo problema, pero sigue ocurriendo que los motores de búsqueda cometen errores cuando un sitio web es accesible con o sin www. Algo que ocurre aunque en menor medida, con HTTP y HTTPS.

 

Uso de parámetros en los sitios web de comercio electrónico

Estamos hablando de cuando los parámetros de búsqueda, paginación, identificación de sesión, filtrado o clasificación se añaden a las URL. La página del producto es la misma, pero para el GoogleBot, hay diferentes URLs. Veámoslo con un ejemplo:

www.example.com/shop/red-sneakers

www.example.com/shop/red-sneakers?number=37

www.example.com/shop/red-sneakers?number=38

www.example.com/shop/red-sneakers?number=39

Cuando se crean URL con fines de rastreo, también se produce este problema.

 

¿Por qué el contenido duplicado es malo para el SEO?

Generar contenido duplicado es malo para el SEO por dos razones principales:

contenido duplicado

  •   Si generas contenido duplicado dentro del mismo sitio, perjudicarás tu SEO, pero no recibirás una penalización de Google. Esto reduce el rendimiento de todas esas versiones, ya que compiten entre sí.
  •   Asimismo, los motores de búsqueda tienen problemas para consolidar la métrica de los enlaces de ese contenido (autoridad de la página, confianza y relevancia), especialmente cuando hay otros sitios que enlazan con varias versiones de ese contenido.

 

¿Puedo recibir una penalización de Google por tener contenido duplicado?

Si generas contenido duplicado dentro del mismo sitio, el SEO se verá perjudicado, pero no recibirá una penalización por parte de Google. Esto rompe un "mito" ya que a menudo se piensa que el motor de búsqueda "castiga" los sitios que contienen contenido duplicado.

Sin embargo, el motor de búsqueda penalizará si extrae el contenido de otra persona. En este caso, y como ya hemos señalado, estaríamos hablando de "contenido copiado" en lugar de contenido duplicado, ya que el contenido no es realmente "duplicado", sino más bien plagiado.

 

Cómo evitar que el contenido duplicado se convierta en un problema

Sabiendo ya cuál es el problema, hay diferentes soluciones a aplicar:

  • Asegúrate de que las URL sean coherentes y utiliza el Google Search Console para indicar cuál es el dominio preferido.
  • Crear contenido original en cada página del sitio web que interese a los usuarios para aparecer en los rankings.
  • Si es inevitable mantener páginas con un contenido muy similar, debes utilizar una etiqueta canónica para la página preferida para que Google pueda identificarla.
  • Evita que los robots se arrastren por páginas no relevantes, usando la metaetiqueta "noindex".
  • Elimina las páginas que no son de interés y redirecciona a las que sí lo son. Este último punto es fundamental ya que si no asignas una redirección, los robots pueden encontrar el error 404 la próxima vez que intenten rastrear las URLs.
  • Establece redirecciones 301 desde las URL no preferidas a las URL preferidas para alertar al motor de búsqueda sobre tus preferencias.
  • Utiliza Google Search Console para eliminar las URL de los resultados de búsqueda y acelerar el proceso para que Google no indexe y examine esas páginas.
Arrow-up