Min menu

Pages

NOTICIAS

Contenido duplicado en SEO: la guía completa

El contenido duplicado no administrado (también conocido como contenido duplicado) es, en mi opinión, uno de los problemas de optimización de motores de búsqueda más perjudiciales para un sitio web, con el potencial de afectar significativamente su clasificación y resultados. desempeño orgánico.

Si ha estado involucrado en el marketing digital durante un tiempo, lo más probable es que haya oído hablar de "contenido duplicado", tal vez de los equipos de SEO de su empresa, los especialistas en marketing de contenido o  las agencias de SEO  asociadas . También puede haber escuchado una explicación y sentir que tiene una comprensión básica de lo que implica el contenido duplicado.

En los últimos años, he leído, visto y escuchado una plétora de diferentes explicaciones de contenido duplicado; desde foros de SEO hasta publicaciones en redes sociales e incluso publicaciones en blogs de agencias profesionales. Hay muchos casos, especialmente desde 2013, en los que se lanzaron sitios con problemas que nunca se identificaron y, por lo tanto, nunca alcanzaron su potencial. Como resultado, no puedo evitar pensar que muchas personas (incluidos los SEO profesionales) no entienden completamente qué es el contenido duplicado y cómo puede afectar su presencia en línea.

Dado el impacto potencial, es sorprendente que haya tanta información errónea sobre qué es el contenido duplicado y cómo solucionarlo. En este artículo te explicaré:

  • ¿Qué es el contenido duplicado?
  • ¿Cómo ocurre el contenido duplicado?
  • ¿Cómo gestionar el contenido duplicado?

Relacionado:  Migración SEO de la A a la Z

¿Qué es el contenido duplicado?

"Su sitio web parece contener grandes cantidades de contenido duplicado".

“¡Pero escribimos todo el contenido nosotros mismos! ?”

El primer obstáculo a superar es el idioma; la mayoría de las veces, las personas asocian el contenido duplicado con el plagio. Este no es el caso.

Hay dos categorías de contenido duplicado:

  • contenido duplicado interno (en el sitio)
  • contenido duplicado externo (fuera del sitio)

Se pueden establecer paralelismos entre los problemas de contenido duplicado fuera del sitio y el plagio, aunque este no es un problema técnico que pueda controlar.

Las causas, los impactos y las soluciones asociadas con cada tipo son completamente diferentes y, créanme, ¡el contenido duplicado interno es el peor de los casos! Es esta categoría la que abordaré en esta guía.

Según mi definición (que puede que haya leído en alguna parte o inventado), "contenido duplicado interno" es un problema técnico de SEO, causado por la forma en que se diseña un sitio web. Ocurre cuando una página web específica se muestra en varias URL diferentes. Este no es contenido que haya sido robado, reutilizado o tomado de otros lugares en la web o de su sitio web.

Contenido duplicado interno: la guía completa

Entonces, ya sabes que casi todos los sitios web impulsados ​​por un sistema de administración de contenido (CMS) producen contenido duplicado: la pregunta es si se administra correctamente o no.

El ejemplo más simple es su página de inicio. Puede aparecer una página de inicio cuando escribe ejemplo.com o www.ejemplo.com. En este caso, el mismo contenido se representa en dos URL diferentes, lo que significa que una de ellas es un duplicado de la otra.

Esto es solo un problema si los motores de búsqueda pueden rastrear duplicados. Dicho esto, nunca subestimes la capacidad de Googlebot para encontrar cosas. Por lo general, tiene un empujón, como un mapa del sitio XML (o HTML) o un enlace CMS mal configurado. Cuando Google le envía más del 50% de sus clientes en línea, vale la pena tomar precauciones.

Entonces, ¿por qué preocuparse por el contenido duplicado interno?

No te preocupes, pero sé consciente de ello. El índice de Google está completamente basado en URL. Cuando la misma página es representada por dos URL diferentes, no hay una indicación clara de qué página es la correcta. Como resultado, ninguna de las páginas se clasifica tan bien como debería en los SERP.

Además, en mayo de 2012, entre una serie de actualizaciones, Google incluyó sanciones más severas por contenido duplicado como parte de su actualización Panda 3.4. Tuve la suerte de trabajar en un sitio en ese momento que fue severamente penalizado después de la actualización, y rápidamente aprendí cómo lidiar con las penalizaciones por contenido duplicado.

Vale la pena mencionar en este punto que, a diferencia de las penalizaciones de enlaces de Penguin, las penalizaciones por contenido duplicado se pueden eliminar muy rápidamente siguiendo los pasos correctos. Según mi experiencia, no es necesario esperar una actualización de Panda.

Signos de contenido duplicado

El contenido duplicado puede aparecer en varios casos, pero ocurre con mayor frecuencia en el momento de una actualización de Panda, después del lanzamiento de un nuevo sitio web o durante los cambios realizados en un sitio donde la administración del contenido duplicado se implementó incorrectamente (o no). en absoluto). Las clasificaciones y el tráfico comienzan a caer, pero el impacto depende de la gravedad del problema.

Si está familiarizado con el contenido duplicado, podrá encontrarlo realizando comprobaciones manuales en un sitio, pero para una comprobación rápida puede realizar una búsqueda en el sitio en Google (sitio:sudominio.com). Si ve el siguiente mensaje en la última página de resultados de búsqueda, es posible que el contenido esté duplicado. Tendrás que investigar más para estar seguro.

¿Cómo se produce el contenido duplicado?

Página de inicio duplicada

Como mencioné al principio, uno de los casos más comunes de contenido duplicado en todos los sitios web es la duplicación entre el subdominio www y el dominio raíz que no es www.

Por ejemplo :

  • www.ejemplo.com
  • ejemplo.com

Dependiendo de su servidor, encontrará que la página de inicio también se puede mostrar en:

  • ejemplo.com/index.php (servidores Linux)
  • www.ejemplo.com/index.php (servidores Linux)
  • ejemplo.com/home.aspx (servidores de Windows)
  • www.ejemplo.com/home.aspx (servidores Windows)

Este es el caso más simple y visible de contenido duplicado, y la mayoría de la gente lo sabe.

Este tipo de duplicación generalmente ocurre en todo un sitio web, por lo que si su sitio se muestra en www.example.com y example.com, probablemente también se esté mostrando en www.example.com/category y example.com/category. Esto significa que los duplicados están presentes en todo el sitio y tienen un impacto significativo en el rendimiento orgánico.

Soluciones

  • Redirección 301 (permanente)
  • Elemento de enlace canónico

Subcarpetas, subcategorías y páginas secundarias

La mayoría de los sitios web utilizan algún tipo de categorías y subcategorías para ayudar a los usuarios a encontrar información. Las categorías suelen ser las áreas más importantes de un sitio de comercio electrónico, ya que intuitivamente apuntan a términos de búsqueda específicos y refinados. Por ejemplo, si estoy vendiendo widgets en Widgets.com y un cliente potencial quiere comprar "widgets azules", la mayoría de las veces se devolverá como resultado una página de categoría para "widgets azules". Lo mismo ocurre con cualquier sitio que categorice el contenido en subcarpetas y páginas secundarias.

Digamos que mi estructura de categorías es la siguiente:

ejemplo.com/categoría/subcategoría

Aquí, el usuario probablemente navegó a la primera categoría y luego a una de sus subcategorías. Muchos sistemas permiten que esta subcategoría se represente en example.com/sub-category sin incluir la categoría principal en la URL. Esta subcategoría ahora muestra el mismo contenido en varias URL; uno que incluye la categoría principal y otro que no.

Lo mismo ocurre con las páginas secundarias que se pueden mostrar en example.com/category/product y example.com/product. Esto puede suceder en un sitio no comercial como example.com/services/service-name y example.com/service-name.

Solución

  • Redirección 301 (permanente)
  • Elemento de enlace canónico

Paginación

En algunos casos, el contenido de una página de categoría puede dividirse en varias páginas; 1, 2 y 3, por ejemplo. A esto lo llamamos una “serie paginada”.

Continuando con el ejemplo anterior, así es como se vería normalmente la página 1:

ejemplo.com/categoría

Se podrá acceder a la página 2 en la siguiente dirección: ejemplo.com/categoría/?p=2

La forma en que se refleja la paginación en la URL depende de la configuración del sitio. En este caso, seguimos en la misma categoría, pero en la segunda página. Los motores de búsqueda bien pueden interpretar las siguientes páginas como duplicados de la página 1.

Solución :

  • Elementos de enlace rel=”siguiente” y rel=”anterior”.

La configuración

La mayoría de los sitios web agregan un parámetro a una URL en función de ciertas condiciones, como el uso de un filtro, una función de "ordenar por" o una variedad de otros propósitos. Una causa común es el uso de "migas de pan" que ayudan a los usuarios a navegar por un sitio. Las migas de pan representan la ruta que tomó el usuario para llegar a una página específica y, por lo general, se puede hacer clic para fines de navegación.

Las migas de pan son específicas del usuario y están impulsadas por parámetros de sesión que a veces son visibles en la URL de la página.

Por ejemplo

ejemplo.com/categoría/subcategoría/producto/?Path=312&214

Aquí, "Ruta" se refiere a la ruta tomada por el usuario, y los números representan categorías específicas. En este ejemplo, el usuario navegó a la categoría 312 y luego a la categoría 214. Esto puede generar migas de pan que se ven así:

inicio -> categoría -> subcategoría -> producto.

Todavía estamos en la misma página de producto identificada en la URL, pero con parámetros de URL que crean las migas de pan.

El mismo contenido se muestra en esta página, pero se puede acceder a él mediante diferentes URL. Este problema se ve agravado por la cantidad de rutas diferentes que puede tomar un usuario, lo que aumenta considerablemente la cantidad de duplicados.

Solución

  • Elemento de enlace canónico

Mayúsculas y barras al final de línea

Algunas plataformas tienden a ignorar las mayúsculas en las URL, lo que permite que una página se muestre independientemente de las mayúsculas. Si se accede a la página desde URL que contienen mayúsculas y URL que solo usan minúsculas, es probable que tenga problemas. Por ejemplo

  • ejemplo.com/categoría
  • ejemplo.com/categoría

Lo mismo ocurre con las barras inclinadas (/) en las URL:

  • ejemplo.com/categoría
  • ejemplo.com/categoria/

Solución

  • Redirección 301 (permanente)
  • Elemento de enlace canónico

Basura aleatoria de CMS

Esto obviamente no es un término técnico. No todos los sitios web se ejecutan en la plataforma CMS más reciente y actualizada. Muchos de ellos están desactualizados, hechos a medida y, francamente, no están en buena forma para SEO.

La calidad de un CMS personalizado, por ejemplo, está directamente relacionada con el conocimiento y las habilidades del equipo de desarrollo que lo construyó. Una ligera falta de conocimiento técnico de SEO puede resultar en un sitio que produce una gran cantidad de contenido dinámico duplicado.

Encontrar este tipo de contenido es bastante simple: haz una búsqueda de sitio en Google usando “site:example.com”. Busque URL indexadas que contengan “?”, parámetros de ruta, “index.php/?”. Suponiendo que sus URL sean compatibles con SEO, lo más probable es que sean duplicados no administrados de páginas canónicas.

Solución

  • Elemento de enlace canónico

Localización y traducción

Hay dos formas de adaptar el contenido a una audiencia. La localización implica proporcionar el contenido en el mismo idioma, pero la información se adapta a cada audiencia para tener en cuenta las diferencias de idioma. Estas variantes pueden existir en un subdominio (us.example.com) o una subcarpeta (example.com/us).

Cuando existan páginas equivalentes para otra localidad (como uk.example.com o example.com/uk), el contenido debe localizarse por dos razones

  • asegurarse de que el contenido correcto esté clasificado para la audiencia correcta
  • para garantizar que el contenido similar no se considere un duplicado.

Lo mismo ocurre con la traducción, excepto que la diferencia está en el idioma. Por ejemplo, fr.example.com o example.com/fr.

Lo importante es que los motores de búsqueda no perciban estas páginas como duplicados no administrados o como páginas diferentes; es la misma página, adaptada para una audiencia diferente.

Solución

  • Abordaré este punto en un próximo artículo.

Otros casos de contenido duplicado

El contenido duplicado puede venir en otras formas. Una vez que comprenda de qué se trata, podrá identificar y corregir los problemas de duplicación. Recuerde que “el contenido duplicado se produce cuando la misma página se muestra en varias URL”.

¿Cómo gestionar el contenido duplicado?

En primer lugar, el contenido duplicado no es algo malo: casi todos los sitios web producen contenido duplicado. El problema es que este contenido no se administra mediante redireccionamientos 301, directivas de robot, elementos de enlace canónico o elementos de enlace alternativos.

Redirecciones 301 (permanentes)

Hasta la introducción del elemento de enlace canónico, los redireccionamientos 301 eran la mejor manera de lidiar con el contenido duplicado. Sin embargo, los elementos de redirección y enlace funcionan de manera diferente.

Una vez que se aplica una redirección 301 al contenido duplicado, el usuario ya no podrá acceder a él y será redirigido (todo está bien) a la versión canónica (correcta). El problema es que muchas veces los duplicados existen precisamente para los usuarios. Continuando con el ejemplo de los parámetros de la ruta, las migas de pan son muy fáciles de usar para los visitantes. Si se redireccionan las URL que incluyen parámetros de ruta, las migas de pan ya no funcionarán correctamente, lo que afectará la navegación del sitio.

Un 301 solo debe aplicarse a páginas que no ofrecen ningún valor añadido al usuario, como el dominio raíz y el subdominio (www.example.com y example.com). Al hacerlo, se mantiene alrededor del 90% de la autoridad de la página del donante a la página de destino de la redirección, lo que consolida su capital de enlace.

Elementos de enlace canónico

El elemento de enlace canónico trata el contenido duplicado igual que una redirección 301, con una excepción: los usuarios aún pueden acceder a la página. Por lo tanto, esta es la forma más eficiente de administrar los duplicados sin arriesgarse a dañar la experiencia del usuario.

Un elemento de enlace canónico se ve así:

<enlace rel=”canonical” href=”http://example.com”>

Apunta a la versión canónica (correcta) de la página web en la que se encuentra. La belleza del elemento de enlace canónico es que se puede aplicar en todo el sitio, brindando protección contra problemas de contenido duplicado, ya sea que haya un problema o no.

La versión canónica de la página debe tener un elemento de enlace canónico autorreferente, es decir, un enlace que apunte a sí mismo. Por lo tanto, todos los duplicados de esta página tendrán un elemento de enlace canónico que apunta a la versión canónica.

Al igual que una redirección 301, el elemento de enlace canónico pasa alrededor del 90-95 % del valor del enlace a la página de destino. Los elementos de enlace canónico también funcionan en todos los dominios. Entonces, si por alguna razón su sitio se representa en un segundo dominio, los elementos del enlace canónico siempre se vincularán al original, evitando problemas de duplicación.

un último consejo

Hay algunos matices para aprovechar al máximo un elemento de enlace canónico y elegir la versión canónica. La versión definida como canónica se clasificará en los motores de búsqueda. Por lo tanto, es necesario utilizar el que tenga más probabilidades de estar bien clasificado.

Por ejemplo, puedo tener una página de producto que se muestre en example.com/mens-shoes/black-shoes y también en example.com/black-shoes. Si alguien busca "zapatos negros para hombres", ¿cuál de estos sitios es más probable que se clasifique? Cuando la categoría o subcategoría contiene términos de búsqueda importantes, puede valer la pena definir la versión canónica como la que los incluye en la URL.

Es posible que haya notado la aparición de "migas de pan estructuradas" en algún momento de 2013, o tal vez no. Tradicionalmente, cuando una página web aparece en las SERP, la URL de la página aparece debajo del título de la página.

Con el código correcto implementado, ahora es posible mostrar la arquitectura real del sitio, basada en migas de pan.

Haciendo referencia a mi ejemplo anterior de categorías, subcategorías y páginas secundarias, para que aparezcan estos elementos bellamente estructurados, las versiones canónicas de las subcategorías DEBEN incluir las categorías principales en la URL para que la versión canónica incluya la ruta de navegación correcta.

Robots.txt

Ni el contenido duplicado ni la indexación  deben manejarse con el archivo robots.txt. Una entrada no permitida en Robots.txt proporciona metadirectivas en el nivel de dominio raíz y es muy común que las páginas no permitidas en Robots.txt continúen siendo indexadas cuando Googlebot u otro rastreador accede directamente a ellas. Una vez que se indexa una página prohibida, permanece en el índice independientemente del contenido de su archivo robots.txt y también evita que los rastreadores detecten elementos de enlace canónicos en las páginas en cuestión. Echa un vistazo a continuación:

Si insiste en tratar de administrar el contenido duplicado mediante el control de la indexación, es mejor usar la metadirectiva "noindex" a nivel de página, una solución mucho más confiable. Sin embargo, esto no pasará la autoridad del enlace a las páginas canónicas como lo haría un elemento de enlace canónico o una redirección 301.

Bueno… ¿alguna pregunta?

Con 2400 palabras, todavía hay mucho que me gustaría escribir sobre el tema, y ​​tal vez lo haga. Si después de leer esto aún no sabe qué es el contenido duplicado, no dude en pedir ayuda en los comentarios a continuación.

Comentarios