Duplicate Content

El contenido duplicado es un problema en SEO, aunque, como veremos, no por la razón que se suele pensar. Analizamos este problema para descubrir cuáles son sus consecuencias reales y cómo evitarlas. Sigue nuestras pautas para deshacerte de él y evitar graves daños a tus esfuerzos de SEO.

Primero, empecemos por lo básico.  

¿Qué es el contenido duplicado?

Según la definición de Google, el contenido duplicado se refiere a fragmentos de contenido dentro o entre dominios que coinciden por completo o son notablemente similares. Otra forma de explicarlo sería contenido que reside en varias ubicaciones. Ahora la pregunta es ¿qué tipo de contenido duplicado existe y por qué se genera? Esto es lo que vamos a abordar a continuación.

contenido duplicado

¿Cómo se define el contenido duplicado?

De la definición de Google, inferimos que hay dos tipos de contenido duplicado:

  • Contenido duplicado dentro del mismo sitio web.
  • Contenido duplicado encontrado entre dos dominios diferentes. En este caso, Google considera contenido duplicado al contenido copiado (scraped).

 

Causas comunes del contenido duplicado

Las principales razones por las que se crea normalmente contenido duplicado son las siguientes:

 

Crear diferentes URLs con el mismo contenido

Si consciente o erróneamente creamos el mismo contenido para diferentes URLs, debemos saber que esto dará problemas de contenido duplicado al motor de búsqueda.

 

ID de sesión en la URL

Este problema de duplicación surge a menudo cuando a cada usuario que llega a la página se le asigna un ID que se almacena en la URL. Ocurre cuando quieres rastrear al usuario o si un carrito de compra está disponible en la web.

 

El CMS no utiliza URLs limpias

La página principal de un sitio web es la home page, ya que es la que tiene más enlaces, tanto internos como externos. Como tiene tantos inlinks y outlinks, es esencial mantener la URL limpia. A veces se crean parámetros de URL que apuntan a la home page, generando contenido duplicado.

 

Paginación de comentarios

Algunos CMS como WordPress incluyen la opción de paginar los comentarios, lo que resulta en contenido duplicado si el número de comentarios es grande.

 

Estructura de URL incoherente / Parámetros de URL utilizados para ordenar y rastrear

Presta atención a estas URLs:

www.myweb.com

myweb.com

http://myweb.com

http://myweb.com/

https://www.myweb.com

https://myweb.com

Para ti son lo mismo, y de hecho, llevan a la misma URL de destino. Pero los bots de los motores de búsqueda no lo ven así y las consideran URLs diferentes. Así que, cuando los bots encuentran el mismo contenido en dos URLs, lo tratan como contenido duplicado.

El mismo problema surge con los trackings de URLs, que también pueden ser identificados como contenido duplicado.

Esta es la razón por la que debes prestar especial atención a tu estructura de URLs.

 

www vs. non-www / http vs. https

Es un problema antiguo, pero todavía ocurre que los motores de búsqueda se equivocan cuando se puede acceder a una web con o sin www. Algo que ocurre, aunque en menor medida, con HTTP y HTTPS.

 

Uso de parámetros en sitios web de comercio electrónico

Hablamos de cuando se añaden parámetros de búsqueda, paginación, IDs de sesión, filtros o clasificación a las URLs. La página de producto es la misma, pero para el GoogleBot, hay diferentes URLs. Veámoslo con un ejemplo:

www.example.com/shop/red-sneakers

www.example.com/shop/red-sneakers?number=37

www.example.com/shop/red-sneakers?number=38

www.example.com/shop/red-sneakers?number=39

Al crear URLs para propósitos de tracking, también ocurre este problema.

 

¿Por qué es malo el contenido duplicado para el SEO?

Generar contenido duplicado es malo para el SEO por dos razones principales:

contenido duplicado

  •   Si generas contenido duplicado dentro del mismo sitio, dañarás tu SEO, pero no recibirás una penalización de Google. Esto reduce el rendimiento de todas esas versiones, ya que están compitiendo entre sí.
  •   Igualmente, los motores de búsqueda tienen problemas para consolidar las métricas de enlaces para ese contenido (page authority, confianza y relevancia), especialmente cuando hay otros sitios que enlazan a varias versiones de ese contenido.

 

¿Puedo recibir una penalización de Google por contenido duplicado?

Si generas contenido duplicado dentro del mismo sitio, el SEO se verá perjudicado, pero no recibirás una penalización de Google. Esto rompe un ‘mito’, ya que a menudo se piensa que el motor de búsqueda ‘castiga’ a los sitios que contienen contenido duplicado.

Sin embargo, el motor de búsqueda sí penalizará si extraes contenido de otra persona. En este caso, y como ya hemos señalado, estaríamos hablando de “copied content” más que de contenido duplicado, ya que el contenido no está realmente ‘duplicado’, sino plagiado.

 

¿Cómo evitar que el contenido duplicado se convierta en un problema?

Conociendo ya cuál es el problema, existen diferentes soluciones que se pueden aplicar:

  • Lo primero es lo primero, audita tu contenido con un Duplicate Content Checker para detectar páginas con contenido muy similar.
  • Asegúrate de que tus URLs son consistentes y utiliza Google Search Console para indicar cuál es el dominio preferido.
  • Crea contenido original en cada página del sitio web que te interese que aparezca en los rankings.
  • Si es inevitable mantener páginas con contenido muy similar, deberías usar una etiqueta canonical para la página preferida, de forma que Google pueda identificarla.
  • Evita que los robots rastreen páginas no relevantes, utilizando la meta tag ‘noindex’.
  • Elimina aquellas páginas que no sean de interés y redirige a las que sí lo son. Este último punto es fundamental, ya que si no asignas una redirección, los robots pueden encontrarse con un error 404 la próxima vez que intenten rastrear las URLs.
  • Establece redirecciones 301 desde las URLs no preferidas a las URLs preferidas para alertar al motor de búsqueda de tus preferencias.
  • Usa Google Search Console para eliminar URLs de los resultados de búsqueda y acelera el proceso para que Google no indexe ni examine esas páginas.

Keywords LSI Códigos de estado HTTP

No dejes que el contenido duplicado perjudique tu SEO

¡Detectalo rápidamente con FandangoSEO!

Pruébalo gratis durante 14 días

Acceso completo a todas nuestras funciones. Sin compromiso alguno.

Empezar

Flecha arriba

Antes de irte...

Si no quieres perderte ningún consejo ni actualización de FandangoSEO, suscríbete a nuestra newsletter.

Más de 5000 SEO confían en nosotros, únete a la comunidad