El plagio en internet es cosa común.
Cualquier persona puede copiar tu contenido, pegarlo en su web diciendo que es suyo y monetizarlo con la publicidad que tiene esparcida en la página.
De hecho, hay páginas web, conocidas como scraper sites, que todos sus contenidos son copiados de otras webs. Otros simplemente cambian un poco el título y ya hacen pasar el contenido como propio. Otros te copian uno o varios párrafos y no te dan crédito como fuente original.
El problema es más serio y perjudicial de lo que parece a simple vista.
Los errores de Google
Que alguien copie tu contenido y lo haga pasar por propio (con o sin retoques) te perjudica por dos motivos:
1. Te hace sentir mal que otro se aproveche de tu trabajo sin tan siquiera darte crédito como el creador del contenido.
2. Google puede cometer errores y dar preferencia al contenido copiado y no al original.
Alguien copia tu contenido y lo publica en su blog. Cuando haces la búsqueda de las palabras clave que deberían llevar a tu contenido te fijas que el resultado que aparece es el de otra web que te ha copiado y tu resultado está más abajo; o todavía peor, sólo aparece la copia y tu resultado no sale por ningún lado!
Esto pasa, lo sé porque esto a mí me ha ocurrido más de una vez y con varios blogs.
La razón es que Google no es infalible en la detección del plagio (contenidos duplicados) y en la asignación de cuál de las fuentes en disputa es la original.
Por lo tanto, se puede dar la situación (y se da) que quien escribió el contenido originalmente sea perjudicado y el plagiador sea recompensado injustamente.
(Aquí tienes un vídeo de Matt Cutts hablando de esta problemática)
Cuando tu sitio web es aún joven es más vulnerable a que Google cometa esos fallos. A mayor PageRank tenga tu dominio y la página concreta donde publicaste el post menor será el riesgo de que la copia suplante al original en la página de resultados de Google.
Esto es así porque Google, entre otras señales, se sirve del PR del dominio y de la página para distinguir el original de las copias. Esta señal tiene su sentido pues normalmente el recién llegado es quien copia contenidos de páginas ya establecidas. Lamentablemente eso no siempre es así y le toca pagar el pato al recién llegado que le han robado su contenido.
Pero ¿cómo lo sabemos si alguien nos ha plagiado y qué podemos hacer de ser así? Paso a paso, veamos primero cómo detectarlo.
Copyscape: la forma más rápida y fiable de detectar el plagio en Internet
Para detectar el plagio de tus contenidos puedes buscar tus artículos uno por uno en Google y ver si aparecen otros resultados indexados que son copias; o bien puedes usar Copyscape y dejar que la máquina lo haga por ti.
(Vídeo presentación de Copyscape)
Copyscape es una herramienta online que te ayuda a descubrir de una forma rápida y fiable si alguien a plagiado tu contenido.
Tiene una versión gratis y una de pago. En la gratuita te permite buscar una a una las páginas que quieras comprobar si han sido plagiadas.
Copyscape Premium, en cambio, es de pago y cuesta 10 centavos de dólar cada búsqueda (más o menos 0,075 euros). Te ofrece una detección más potente, que la opción gratuita, de contenidos plagiados.
Además, y esto es importante, con Copyscape Premium puedes copiar textos y pegarlos en una cajita y buscar si se trata de un contenido duplicado u original.
Esto es interesante porque te permite saber de antemano si el contenido que vas a publicar en tu blog puede ser identificado como duplicado por Google o no.
Aquí estoy pensando en dos situaciones:
1. Si otro produce contenidos para tu página web. Pongamos que pagas a alguien para que produzca contenidos para el blog de tu Web. ¿Cómo saber si el contenido es original o es una copia o refrito mal hecho de otro post sacado de la Red?
2. Si tú mismo produces el contenido pero te sirves para ello de otras fuentes que encuentras en la Red.
Si Google considera tu contenido duplicado no tan sólo corres el riesgo de que lo filtre y no aparezca en la página de resultados (o incluso que ni se indexe) sino que en los casos más graves puedes incluso ser penalizado.
“Hay algunas penalizaciones que están relacionadas con la idea de tener el mismo contenido que otro sitio – por ejemplo, si tú estás copiando “scraping” contenido de otros sitios y publicándolo, o si lo publicas sin añadir ningún valor adicional. Estas tácticas están claramente esbozadas (y desaconsejadas) en nuestras directrices para Webmasters”. (Traducción suplida). Susan Moskwa, Webmaster Trends Analyst.
Pero esto era antes de los cambios de Google Panda, ahora (desde febrero de 2011) la cosa es aún más seria. Ahora tener contenidos duplicados en tu página web deja de ser un problema aislado de la página que contiene el contenido duplicado y afecta a todo tu sitio web. Es decir, que otras páginas de tu sitio web, que no tienen contenidos duplicados, pueden perder posiciones en la página de resultados de Google o incluso desaparecer del índice.
Para evitar publicar esos contenidos duplicados en tu blog tienes a tu disposición Copyscape.
Copysentry, otro servicio de Copyscape, se encarga de escanear tu web cada día o semanalmente y te manda un email cuando encuentra que se han hecho nuevas copias de tu contenido.
Además, Copyscape ofrece unos banners que puedes poner en tu web para alertar a los potenciales plagiadores que visiten tu página con malas intenciones de que tu sitio está siendo controlado y que no permites que te roben el contenido.
Prevenir y combatir el plagio
Es imposible evitar que te plagien pero sí que puedes tomar ciertas medidas para prevenirlo y para tratar de combatirlo:
1. Coloca en el footer de tu página web un banner de alerta contra el plagio.
2. Incluye en el footer de tu página web: © tupáginaweb.com Todos los derechos reservados. Para añadir el símbolo en HTML tienes que usar: ©
3. Utiliza Copyscape en su versión gratuita o de pago (Copysentry) para detectar las copias ilegales de tu contenido.
4. Si a pesar de ello han copiado tu contenido deberías ponerte en contacto con quien te ha plagiado y pedirle que elimine su entrada y que no vuelva a hacerlo en el futuro.
La mayoría de gente accede a quitarla pues no les conviene que la cosa vaya a mayores. Si a pesar de ello no borran la entrada copiada dile que notificarás del abuso a su proveedor de hosting (lo averiguarás aquí Whois) y a Google a través de un spam report. Si el tema es serio habla con tu abogado para que te explique otras opciones. Confío en que no tengas nunca que llegar a esos extremos.
Espero que te sirva esta herramienta. A mí me parece muy útil, ya no tanto para detectar el plagio ajeno (que también) sino sobre todo para saber si los contenidos que produces tú mismo (u otro a quien le has encomendado la tarea) son copias o no.
Si externalizas la producción de contenidos esta es una herramienta que merece la pena probar.
¿Qué opinas? ¿Es el plagio de contenidos un problema o no es para tanto? Me gustaría conocer tu opinión al respecto.
Comparte este post en Twitter y Facebook si te ha sido útil. Gracias!
Información Bitacoras.com…
Valora en Bitacoras.com: El plagio en internet es cosa común. Cualquier persona puede copiar tu contenido, pegarlo en su web diciendo que es suyo y monetizarlo con la publicidad que tiene esparcida en la página. De hecho, hay páginas web, conocida……
muy buen post david, muchas gracias por la info.
Lo del plagio y llegar a poner una demanda me parece una exageración, tus ideas y las escribas en un blog me parecen que las ideas no tiene copyright, Yo tengo un blog y si esas ideas le sirven de inspiración a otro para agregar más información o complementarlo, para criticarlo e incluso copiarlo así nada más lo pueden hacer. Así se me ocurre una idea seguro que a muchas miles de personas también. No somos tan originales muchas veces como creemos, en el mundo hay 7000 millones de personas unas más listas que otras. Lo que pasa que la competencia por un pedazo de tarta del mercado y creernos que somos únicos esa es el hambre del copyright o del plagio. No somos tan especiales como creemos ni tan únicos como pensamos. La mayoría somos comunes y corrientes y si una idea le sirve para que otra se sienta mejor o le ayuda entonces copy y paste. Sr Intelligenius.
Hola. Eso ya depende de cada uno. Tú puedes sentirte bien si alguien te copia palabra por palabra tu contenido, ni siquiera dice que lo leyó de ti, se beneficia económicamente de ello y además te perjudica el posicionamiento de tu entrada. Yo conozco casos de gente perdiendo dinero por culpa de plagiadores que lo único que quieren es lucrarse del esfuerzo ajeno. Eso no parece justo.
Como digo, eso depende de la situación y de los principios de cada uno. Si no te importa el plagio puedes liberar tus contenidos de derechos de autor, como hizo Leo Babauta. Pero igual de respetable es eso como el que se reserva todos los derechos sobre sus contenidos. Dicho lo cual, si alguien perjudica tu negocio con una actividad ilegal y no cesa ante tus reclamaciones, la via judicial puede ser oportuna. Habría que considerar el caso concreto y ver la magnitud del daño causado.
Un saludo y gracias por participar con tu punto de vista. Es un tema que se presta al debate.
David, coincido contigo, el beneficiarse del trabajo y el esfuerzo del otro no lo considero justo.
El plagio lamentablemente es un recurso por muchos utilizados, principalmente en internet. Por otro lado coincido con Sr Intelligenius en que la originalidad es algo complicada de encontrar, aunque bien podemos citar debidamente las fuentes, cosa que en el ámbito académico es algo normal de hacer. Es de bien nacidos el ser agradecidos y, entiendo en lo personal, que el citar una fuente lejos de desmerecernos nos muestra como personas respetuosas del trabajo de los demás.
Un punto interesante que mencionas David es el de las licencias; en mi caso las publicaciones del blog son de libre distribución, pues así lo consideré oportuno al momento de registrar el contenido. Simplemente pido que se me cite o, cuando menos, se coloque un enlace a la fuente original. Incluso cuando publico artículos en otros medios digitales, posteriormente los cuelgo en mi blog y coloco en enlace a la publicación original, insisto, de mi propio articulo.
También coincido contigo David que éste es un tema que se presta a debate, ahora, el punto es que debatir las ideas es un ejercicio más que saludable, por lo tanto gracias por ponerlo sobre la mesa.
Un tema ciertamente muy subjetivo y del cual cada uno toma partido en base a sus propios intereses.
Un saludo y mis mejores deseos para todos.
Buen artículo! Voy a utilizar el copyscape para ver si alguien copia mi contenido o mis autores lo hacen..una de dos 🙂
[…] […]
la herramienta es maravillosa,gracias a ella descubri un sitio donde me clonaron 2 subpaginas de mi web, y encima para descargar el contenido de mis dos paginas robadas por el, pedia dinero via pay pall,se lo hice saber al que me plagio ,que lo denunciaria y elimino las 2 subpagias que me habia facchado,despues de esto,utilizo esta herramienta,todas las semanas,pues aun quedan gente con mucha cara.Es muy necesaria
Muy buena herramienta, gracias por la info.
Hola David,
Muchas gracias por el post. Muy útil, ya que desafortunadamente existen muchos farsantes que se dedican a copiar en Internet y a mostrar el contenido en sus webs como si fuese suyo.
Mi pregunta es ¿qué medidas se pueden tomar contra alguien que parafrasee todo un post de tal manera que Google no lo detecte? Me he encontrado más de un caso así…
Hola David,
Pues sí, se me acaban de copiar carácter a carácter una entrada de un blog. Este es el original:
http://viviendo20.wordpress.com/2013/12/12/la-nata-del-capuccino-reflexion-sobre-el-precio-de-los-productos/
Y esta es la copia (que ha copiado el html completito):
[link eliminado – editado]
Sin embargo, el whois me da:
% NOTE: The registry for this domain name does not publish ownership
% records (whois records) in the standard format. This data
% represents the most likely status of the domain based on
% information provided by the Internet’s domain name servers (DNS).
domain: market-ing.es
status: taken
nameserver: dns105.ovh.net
nameserver: ns105.ovh.net
¿Alguna idea?
Hola Alfonso,
Te comento…
Lo mejor es la solución amistosa: tú le pides que lo borre y él o ella lo borra.
El problema es que a veces no se conoce su email porque lo oculta o bien no responde.
En ese caso debes descubrir quien le registró el dominio y hacerles la queja a ellos denunciando lo sucedido con su cliente.
Si eso no funciona, lo puedes denunciar a Google, para que desindexe su entrada en Google, lo que significa a efectos prácticos que nadie o casi nadie la va a ver nunca. Esta opción se recomienda para casos repetidos y que producen un perjuicio demostrable.
También puedes ir a un abogado, para que proceda por ti, y en casos graves a los tribunales.
He seguido el enlace de la página infractora y parece que han suspendido su cuenta, así que en principio se ha resulto el problema solo, con lo cual te ahorras lo arriba comentado.
He editado el link eliminándolo porque a parte de que ya no hay nada al otro lado, prefiero no enlazar a páginas de este tipo, pues lo único que faltaba era darles promoción por su conducta negativa.
Por cierto, en tu post he visto que haces un comentario de que no estás de acuerdo que poner la indicación de “todos los derechos reservados” ayude. Ya sabemos que no es necesario indicarlo para que tu contenido se considere protegido por los derechos de propiedad intelectual, pero sinceramente, como funciona internet, nunca está de más ponerlo, precisamente para intentar disuadir comportamientos del tipo aquí comentado.
Ponerlo o no ya decide cada uno. La practica generalizada de los grandes blogs es indicar qué tipo de derechos tiene el propietario del blog con los contenidos que se publican, ya sean todos o algunos, como pasa en las opciones de Creative Commons.
Un saludo,
[…] http://davidcantone.com/plagio-en-internet/ […]
Hola David,
Ante todo gracias por la respuesta. Como comenté, no pude encontrar información sobre el registro del dominio (no sé realmente cómo se puede hacer esto), pero como comentas la cuenta ha sido suspendida. :). Desde luego, se lo merece, porque se dedicaba a piratear todo.
Gracias por lo de Google, la próxima vez lo hare!
Un abrazo.
Alfonso
DAVID gracias por la información q compartes y me ha sido de mucho interés y seguiré mirando tus paginas ,me educo de forma fácil y amena ,ATENTAMENTE LUIS.
Totalmente de acuerdo. El plagio de material de blogs y páginas web puede hacer mucho daño al dueño del contenido original.
En mi caso, empecé un blog hace poco sobre un programa que estaba empezando a tener muchas descargas y un gran número de usuarios, pero no tenía página web en español. Sin embargo, si la tenía en otros idiomas, con gran cantidad de usuarios, por lo que me dispuse a hacer la “versión española”.
Pero hace poco, “descubrí” mi competencia navegando por google, al ponerme a investigar un poco, esta página copia literalmente todas las entradas de mi blog, desde el título hasta el final, sin cambiar una sola palabra y atribuyéndoselo como suyo. No se cortan ni siquiera en buscar sus propias imágenes, ya que también son mías, y tampoco ponen un enlace.
En google no me afecta de momento, ya que al poner las palabras clave, me muestra mi página web primero, pero a lo mejor, en un futuro me podría afectar.
Cada entrada que publico, a las pocas horas es copiada “literalmente” por esta web. Y me afecta, ya que para cada entrada necesito varias horas, mientras que ellos, unos pocos segundos.
Todavía no he contactado con ellos, me gustaría mandarlo directamente al spam report de google. ¿Tu que opinas?
Lo que comentas es un caso grave de plagio. Primero siempre suele ser recomendable darles la oportunidad de que desistan de forma amistosa, pero en casos de estos en los que se aprecia un plagio masivo (plagia todo tu contenido) es casi mejor solicitar directamente a Google que retire ese contenido plagiado.
Espero que puedas solucionar el problema.
Un saludo.
A mi me pasó que hice una recopilación de miles de citas famosas, hacía años que las coleccionaba, incluso antes de que apareciesen las webs en 1990, tardé 6 meses en clasificarlas por temas y hacer una web sencillita con ellas.
Al principio la página me resultaba rentable hasta que empezaron a hacer copy-paste directamente de algunas de mis páginas.
Algunos de los plagiadores borraron sus listados cuando les escribía, otros tuve que denunciarlo a hasta que me encontré a uno en Blogger que decía allí ser abogado, que se negó a quitarlo.
Entiendo que las “citas famosas” no pertenecen a nadie, pero que alguien se copie mi listado, exactamente en el mismo orden, incluso con puntos, comas, y alguna pequeña falta de ortografía que se me coló, es ya un plagio descarado.
Informé a Google y me dijeron que yo no tenía suficientes pruebas, y me contestaron algo así como que “harían alguna acción si yo les enviaba una copia de la resolución de un juez en una demanda ante los tribunales”.
Después de esto, han aparecido varias webs enormes, que han “absorbido” mis listados, lo sé seguro porque entre mis frases, puse algunas que me las inventé yo precisamente para detectar a los “copiones”.
Ahora mi web tiene poquísimas visitas y si busco las frases inventadas por mi que puse en esos listado, en los resultados de Google aparecen un montón de webs de citas y frases famosas que se la han copiado (junto a todo el resto de mis listados)… por contra, la mayoría de páginas de mi web ya ni aparece en los listados de Google o aparecen en posiciones bajísimas (tipo posición 40).
En definitiva, a ojos de Google parece que soy yo un plagiador, y por contra, todos esos buitres carroñeros, están en los primeros puestos.
Me da una rabia….
Ah! y otro tema que no comentas aquí y que me tiene frito es el hotlinking.
Hago imágenes propias, me cuestan mucho tiempo crearlas, las cuelgo en mi web, viene un idiota y la cuelga en su web, y además ni tan sólo la sube a su servidor, la carga directamente desde mi web.
Y a los pocos meses me encuentro que Google Images tiene indexada MIS imágenes como si fuese del plagiador! No entiendo como Google Image puede ser tan burro de indexar páginas que hacen hotlink de manera descarada.
Y claro, cada vez que veo eso, me toca modificar el .htaccess de mi servidor para rechazar peticiones que provengan de la web plagiadora.
Pero estoy ya harto de esta historia y no entiendo como Google puede ser tan incompetente en este tema.
Hola David, gracias por tus valiosos post.
Estoy a punto de sacar mi nueva página y decidí hacer mis propias imágenes, recomiendas alguna forma de protegerlas desde el principio antes de publicarlas?
Gracias por tu apoyo.
El plagio es de las peores cosas que Google no puede controlar, a mi me parece que es sumamente injusto, y Google hasta el momento no tiene una tecnologia para detener el plagio, por que he publicado articulos que otras personas se han robado que incluso aparecieron alguna vez por encima del mio, una tristeza.
Hola, me gustaría saber si CopyScape puede detectar plagio pero traducido, es decir, si yo pago a alguien para que escriba articulos para mi blog pero el contenido original estaba en ingles y mi escritor solo lo tradujo al español y me la dió como que lo escribió él, si utilizo este programalo puede detectar igual? No se si se entiende mi pregunta.
Si alguien sabe y me pueda dar una mano
Gracias!!