Contenido Duplicado - 9 Medidas para evitarlo
En este artículo hablaremos sobre el contenido duplicado, veremos como puede afectarnos al posicionamiento de nuestra web. Así como las medidas a tomar para evitarlo y como localizar el contenido duplicado.
Este artículo ha sido redactado basándome en mi experiencia como desarrollador web y la propia documentación de Google. Documentación que puedes consultar tu mismo, te he dejado el enlace al final de este mismo artículo. Es muy recomendable si quieres ampliar información.
Contenido Duplicado - Introducción
Posicionar nuestra web no siempre es fácil. Más cuando tienes que competir con otras páginas que se dedican a copiar nuestro contenido para intentar ganar posiciones en Google. En este artículo vamos veremos como poner remedio a este problema, para ello usaremos varias herramientas web que también nombro a continuación.
Antes de empezar tenemos que tener muy clara la premisa absoluta sobre el contenido de nuestra web:
Nuestro contenido debe ser original y de calidad.
Para que nuestra web tenga un buen posicionamiento SEO tenemos que cumplirla si o si. Ello significa más trabajo si, pero posicionar una web conlleva trabajo. Debemos tener contenido original, textos redactados por nosotros o por alguien que podamos contratar para hacerlo. En internet hay muchos redactores que se dedican a tal propósito, podemos contratarlos por un módico precio, por ejemplo, en Publisuites
Es importante recalcar también que al igual que pasa con el texto, las imágenes también son susceptibles de ser copiadas, por lo tanto nosotros debemos usar imágenes propias. Creadas por nosotros. Incluso las fotos sacadas de bancos de imágenes darán positivo en contenido duplicado y podrán perjudicar nuestro posicionamiento. En caso de comprarlas sería conveniente modificarlas lo suficiente para que parezcan diferentes, dado que otras personas también pudieron comprar y usar dichas imágenes.
¿Qué es el Contenido Duplicado?
Un contenido duplicado es un contenido repetido, no original.
Si un motor de búsqueda encuentra contenido duplicado en Internet, hará un estudio sobre qué web es más fiable y en cuál de ellas fue publicado antes este contenido. Penalizando la web contraria y relegando las posiciones de la misma. Incluso es posible que, dicha web, reciba una penalización por incluir de forma masiva contenido duplicado si lo hace reiteradamente.
Con que una web copie el 30 % de nuestro contenido, ambas webs ya pueden dar positivo en contenido duplicado según Google, procediéndose a discernir la “culpabilidad”. Es por ello que debemos ser celosos con nuestro contenido y evitar la copia del mismo.
Incluso nuestra web puede tener partes dentro de la misma que parezcan idénticas una misma página a la que se puede acceder mediante diferentes urls, para ello tenemos que aprender a usar la etiqueta canonical, la cual informa al motor de búsqueda de que ese contenido pertenece a esa URL dentro de nuestra web.
¿Quién dice si un contenido es duplicado o no?
Google por supuesto. Pero si es Google quien se entera primero, probablemente te penalizará. Para ello tienes que comprobar el contenido con algún programa o herramienta web, a continuación te aconsejo las que yo utilizo con mis clientes, son webs y son gratuitas.
Herramientas para localizar contenido duplicado
Como evitar duplicados y copia de contenido
Lo primero es averiguar si nos han copiado y quién ha sido. Para ello usaremos las siguientes herramientas:
- copyscape.com, la primera herramienta web que podemos utilizar.
- siteliner.com, la herramienta por excelencia, no hay otra igual. Es hermana de la anterior, pero ésta ofrece información sobre enlaces rotos, además de un informe bastante completo entre otras funcionalidades.
Me han copiado ¿Y ahora qué?
Si nos han copiado el contenido, no nos han enlazado, ni siquiera han nombrado la fuente original y podemos comprobar que nos perjudica y posiciona mejor que el nuestro, debemos denunciarlo a Google. Para ello podemos utilizar por ejemplo la herramienta support.google.com/legal/troubleshooter.
No está de más tampoco, por ejemplo, especificar en el contenido que creemos el tipo de licencia de uso que tiene, para lo cual podemos estudiar las diferentes posibilidades:
Tipos de licencias Creative Commons
Las reconocerás por su consiguientes logotipos:
1.- RECONOCIMIENTO (BY)
Se permite cualquier explotación de la obra, incluyendo una finalidad comercial, así como la creación de obras derivadas, la distribución de las cuales también está permitida sin ninguna restricción.
2.- RECONOCIMIENTO – NOCOMERCIAL (BY-NC)
Se permite la generación de obras derivadas siempre que no se haga un uso comercial. Tampoco se puede utilizar la obra original con finalidades comerciales.
3.- RECONOCIMIENTO – NOCOMERCIAL – COMPARTIRIGUAL (BY-NC-SA)
No se permite un uso comercial de la obra original ni de las posibles obras derivadas, la distribución de las cuales se debe hacer con una licencia igual a la que regula la obra original.
4.- RECONOCIMIENTO – NOCOMERCIAL – SINOBRADERIVADA (BY-NC-ND)
No se permite un uso comercial de la obra original ni la generación de obras derivadas.
5.- RECONOCIMIENTO – COMPARTIRIGUAL (BY-SA)
Se permite el uso comercial de la obra y de las posibles obras derivadas, la distribución de las cuales se debe hacer con una licencia igual a la que regula la obra original.
6.- RECONOCIMIENTO – SINOBRADERIVADA (BY-ND)
Se permite el uso comercial de la obra, pero no la generación de obras derivadas.
Normalmente, si nos copian podemos ponernos en contacto con el encargado o responsable de contenidos digitales de la empresa o web que nos haya copiado, a través del formulario de contacto, email o teléfono que exista a disposición de los usuarios. Debemos exponer que el contenido es nuestro y exigir que sea eliminado inmediatamente. Otra opción es abrir la posibilidad de una colaboración, de forma que recibamos alguna contraprestación a cambio del uso de nuestro contenido. lo que sí es recomendable es que antes de denunciar contenido por infringir derechos de autor intente hablarlo con el propietario del sitio.
Google colabora con el proyecto lumendatabase.org, que estudia todo tipo de contenido que pueda infringir las leyes aplicables.
Utilice a menudo cualquiera de las dos herramientas citadas anteriormente para comprobar si en su web existe contenido duplicado.
9 Medidas para evitar el contenido duplicado
- Utiliza redireccionamientos 301: si has reestructurado tu sitio, utiliza los redireccionamientos 301("RedirectPermanent") en el archivo .htaccess para redireccionar de forma inteligente tanto a los usuarios como a Googlebot y a otras arañas. En Apache, puedes hacerlo mediante el archivo .htaccess, y en IIS, con la consola administrativa.
- Seamos coherentes con nuestros enlaces internos: es decir, enlacemos siempre a nuestras páginas con una misma url, si mi página https://miguelgomezsa.com/pagina se puede acceder desde https://miguelgomezsa/?p=1 o https://miguelgomezsa.com/?post=1 o http://miguelgomezsa.com/pagina o https://www.miguelgomezsa.com/pagina. Debemos usar siempre el mismo enlace, en este caso el correcto sería: https://miguelgomezsa.com/pagina
- Utiliza dominios de nivel superior: para ayudarnos a mostrar la versión más adecuada de un documento, utiliza dominios de nivel superior para administrar el contenido específico de un país siempre que te sea posible. Es más probable que, por ejemplo, sepamos que
http://www.example.de
incluye contenido centrado en Alemania quehttp://www.example.com/de
ohttp://de.example.com
. - Distribuye el contenido con precaución: si distribuyes tu contenido en otros sitios, Google siempre mostrará la versión que considere más apropiada para los usuarios en una búsqueda determinada, que puede o no coincidir con la versión que prefieres tú. Sin embargo, resulta útil asegurarse de que cada sitio que distribuye tu contenido incluya un vínculo que apunte al artículo original. También puedes pedir a aquellos que utilizan el material distribuido que utilicen la metaetiqueta noindex para evitar que los motores de búsqueda indexen su versión del contenido.
- Usa Search Console para indicarnos cómo prefieres que se realice la indexación de tu sitio: puedes facilitar a Google tu dominio preferido (por ejemplo,
http://www.example.com
ohttp://example.com
). - Reduce la repetición de expresiones: por ejemplo, en vez de incluir un amplio texto sobre los derechos de autor en la parte inferior de cada página, puedes incluir un breve resumen y un enlace a una página con más información. Además, puedes utilizar la herramienta de organización de parámetros para especificar cómo quieres que Google gestione los parámetros de URL.
- Procura no publicar contenido incompleto: a los usuarios no les gusta encontrarse con páginas "vacías", así que evita los marcadores de posición siempre que puedas. Por ejemplo, no publiques páginas sin contenido. Si incluyes páginas en blanco, utiliza la metaetiqueta noindex para evitar que se indexen estas páginas.
- Conoce el sistema de administración de contenido: asegúrate de conocer la forma en que se muestra el contenido de tu sitio web. Los blogs, foros y sistemas relacionados con frecuencia muestran el mismo contenido en distintos formatos. Por ejemplo, la entrada de un blog puede aparecer en la página principal, en una página de archivo y en una página con otras entradas bajo la misma etiqueta.
- Reduce el contenido similar: si tienes muchas páginas similares, plantéate ampliar cada página o agruparlas en una sola. Por ejemplo, si tienes un sitio para viajeros con páginas por separado sobre dos ciudades pero con la misma información, puedes unir la información en una sola página o bien ampliar los datos de cada una de ellas con contenido único para cada ciudad.
Más información en la propia documentación de Google, siguiendo este enlace:
https://support.google.com/webmasters/answer/66359?hl=es