contenido web duplicado

Contenido duplicado, qué es y cómo solucionarlo (II)

en

En nuestro artículo anterior, os hablábamos acerca de la consideración de Google sobre el contenido duplicado, los problemas que podría acarrearnos y por qué motivos podíamos encontrarlo, tanto dentro fuera de nuestra página web.
En esta ocasión, nos dejamos de rodeos y pasamos a la acción. Así las cosas, podremos ver las distintas formas que tenemos para detectar contenido duplicado, fuera y dentro de nuestra página, así como el método para acabar definitivamente con él.


Detectando el contenido duplicado en el sitio web

contenido duplicado eliminarlo
Existen diferentes formas con las que podremos detectar el contenido duplicado. Las siguientes son las empleadas comúnmente.

  • Google Webmaster Tools: A través de la herramienta Search Console de Google, se realiza una monitorización de tu sitio web sobre el estado del mismo y la visibilidad en las SERPs (Search Engine Results Page). Para ver problemas detectados sobre contenido duplicados, sólo tienes que visitar Aspecto de la búsquedaMejoras de HTML. En esta sección puede ver problemas relacionados con las duplicidades de meta etiquetado.
  • Usando el comando “site”: El comando site permite listar las páginas indexadas de tu dominio. Bajo el formato site “dominio.com” podremos ver todas las urls indexadas. Si al final de nuestros resultados encontramos el aviso “repetir la búsqueda e incluir los resultados que se han omitido”, tendremos que revisarlos manualmente y observar si es posible que encontremos indicios de secciones con duplicidades.
  • Screaming Frog: Se trata de otro clásico. Con Screaming Frog puedes realizar un rastro completo e identificar mediante el filtro Duplicate los elementos duplicados; como h1, h2, meta keywords, meta descriptions o URLs.
  • Xenu: Se trata de otra herramienta de escritorio. Al igual que Screaming Frog, nos permite hacer un crawler a nuestro sitio web. Si bien Xenu es menos potente y versátil, a cambio de esto es 100% gratuita, mientras que Screaming Frog presenta una limitación de 500 urls analizadas.
  • Google Analytics: estamos en este caso ante un proceso manual, que consiste en identificar en las páginas de destino las URLs que reciben poco tráfico como indicio de que algo puede estar ocurriendo.
  • Aplicaciones: Existen servicios web (Moz, Siteliner, etc.) o aplicaciones (Website auditor, etc.) que permiten identificar determinados elementos que pueden estar duplicándose sin que te des cuenta.

Detectando el contenido fuera del sitio

Ahora bien, controlar el contenido duplicado fuera de nuestro sitio web es otra cuestión. Para esta tarea tendremos que recurrir a aplicaciones diseñadas para tal fin.

  • Copyscape: Sin duda alguna, es la herramienta más conocida y usada para ver qué páginas pueden estar plagiando nuestra información. Cuenta con dos versiones: gratuita y premium, y en cualquiera de ellas señalará las urls donde se encuentra el contenido plagiado y subrayará dicho contenido de manera muy visual.
  • Similar Page Checker: Permite introducir dos páginas y medir el grado de similitud.
  • Otros servicios: Existen más servicios que  nos permitirán tener un mayor control de lo que sucede con nuestro contenido fuera de nuestro sitio, aunque con Copyscape, fundamentalmente, deberíamos tener todo lo que necesitamos. Dupli cheker permite, por ejemplo, introducir el texto a buscar o incluso subir un archivo .doc o .txt con dicho extracto. Plagiarisma es otro servicio pensando especialmente para estudiantes y profesores que cumple con similar cometido.

Cómo acabar con el contenido duplicado

contenido duplicado solucionarlo
De la misma forma que venimos analizando, hay que tener en cuenta si el contenido duplicado está dentro o fuera del sitio web.

Acabando con el contenido duplicado dentro del sitio

  • Utiliza la etiqueta Rel Canonical: Para eso y no para otra cosa se desarrolló esta etiqueta, para indicar a los buscadores que la url en la que se encuentra es la versión correcta.
  • Redirecciones 301: Se trata de redirecciones finales, por lo que el usuario es “desplazado” a la página apuntada mediante la redirección 301. No tenemos la opción de tener varias página que puedan potencialmente recibir visitas, sino una única a la que todo el tráfico será redirigido. No es lo más elegante, pero cuando no podemos usar el rel canonical es lo más efectivo.
  • Robots.txt: El archivo robots.txt actúa filtrando lo que permite que los buscadores indexen y lo que no. Tampoco es lo más elegante, ya que ponemos a la vista de cualquier visitante que visite nuestro robots.txt los indicios del contenido que bloqueamos intencionalmente.
  • Reescribir contenidos: Se trata de una tarea a la que nadie enamora hacer, pero en muchos casos es lo más efectivo. De la redacción tiene que resultar un contenido “nuevo” que los buscadores identifiquen como distinto del original. Este spineado se tiene que ser manualmente y con cuidado.
  • Unificar páginas: A veces es mejor concentrar en una misma página varias URLs que contengan texto muy similar. Posiblemente sea bueno tanto para el posicionamiento orgánico como para la experiencia de usuario.

 

Eliminando el contenido fuera del sitio

Aquí es cuando las cosas se ponen interesantes. Existen determinadas acciones que tienes en tu mano, pero siempre debe imperar la lógica y el sentido común.

  1. Ponte en contacto con la fuente del plagio: Lo primero es ponerse en contacto con el administrador del portal en el que has identificado el contenido plagiado. Puedes buscar un email, rellenar el formulario de contacto u obtener un correo electrónico a través, por ejemplo, del whois del dominio. Aquí tienes 2 opciones:
    1. Pedirles que eliminen el contenido: Lo pueden eliminar directamente o reescribir, pero en cualquier caso no debe identificarse con el tuyo.
    2. Pedirles un enlace: Un enlace siempre es un enlace. Puedes pedirles que a cambio te enlacen como fuente del artículo. Google detectará este link. 🙂
  2. Solicitar la eliminación: A veces no es posible conseguir los objetivos del punto 1. Siempre puedes pedir a Google que considere la eliminación de contenidos. En el siguiente enlace puedes encontrar el formulario de retirada de contenidos.

Además de esto, puedes mandar un reporte a Google sobre contenido duplicado, aunque dicho reporte sólo se tendrá en cuenta para sus algoritmos futuros.


Buenas prácticas

contenido web duplicado consejos
Mantener una buena higiene a nivel de contenidos es esencial, tanto por credibilidad, como por cuestiones de posicionamiento y paz de espíritu. Estas buenas prácticas son evidentes, pero nunca están de más recordarlas.

  • ¿Vas a copiar? ¡No lo hagas!: A veces no tenemos tiempo o encontramos un texto tan bien redactado que queremos llevarlo a nuestra web tal cual. No lo hagas, genera tu propio contenido, y que sea único y de calidad.
  • ¿Vas a citar?: Si citas alguna web, incluye un enlace al sitio original.
  • Secciones con contenido idéntico: Si tienes secciones con el mismo contenido, Plantéate reunir estas secciones en una única página, si no es posible, o simplemente no es el caso, reescribe el contenido o bien usa rel canonical.
  • Títulos y textos únicos: Asegúrate que todos los títulos y textos de tu web son únicos. Si tienes acceso a editar el meta etiquetado, asegúrate que todos sean distintos y pertinentes.
  • ¿Tienes que copiar una página completa?: Pide siempre permiso por escrito, guarda bien la respuesta, incluye un enlace identificando con claridad que es la fuente original y bloquea esta URL a los buscadores.

Compartir

Share on twitter
Share on facebook
Share on linkedin
David Mena

David Mena

Consultor de Marketing Digital

¿Quieres recibir nuestros nuevos artículos en tu correo electrónico?

Estás a un paso de hacer crecer tu negocio

Contacta ahora con un consultor experto de Wanaleads. Cuéntanos tu proyecto y te diremos cómo aplicar una estrategia de Marketing Digital para empezar a vender más.

Llegar a buen puerto con Marketing Digital
¡PÍDELA AQUÍ GRATIS!