Copyscape: Descubre y Combate el Plagio de tus Contenidos en Internet

Plagio en Internet

El plagio en internet es cosa común.

Cualquier persona puede copiar tu contenido, pegarlo en su web diciendo que es suyo y monetizarlo con la publicidad que tiene esparcida en la página.

De hecho, hay páginas web, conocidas como scraper sites, que todos sus contenidos son copiados de otras webs. Otros simplemente cambian un poco el título y ya hacen pasar el contenido como propio. Otros te copian uno o varios párrafos y no te dan crédito como fuente original.

El problema es más serio y perjudicial de lo que parece a simple vista.

Los errores de Google

Que alguien copie tu contenido y lo haga pasar por propio (con o sin retoques) te perjudica por dos motivos:

1. Te hace sentir mal que otro se aproveche de tu trabajo sin tan siquiera darte crédito como el creador del contenido.

2. Google puede cometer errores y dar preferencia al contenido copiado y no al original.

Alguien copia tu contenido y lo publica en su blog. Cuando haces la búsqueda de las palabras clave que deberían llevar a tu contenido te fijas que el resultado que aparece es el de otra web que te ha copiado y tu resultado está más abajo; o todavía peor, sólo aparece la copia y tu resultado no sale por ningún lado!

Esto pasa, lo sé porque esto a mí me ha ocurrido más de una vez y con varios blogs.

La razón es que Google no es infalible en la detección del plagio (contenidos duplicados) y en la asignación de cuál de las fuentes en disputa es la original.

Por lo tanto, se puede dar la situación (y se da) que quien escribió el contenido originalmente sea perjudicado y el plagiador sea recompensado injustamente.


(Aquí tienes un vídeo de Matt Cutts hablando de esta problemática)

Cuando tu sitio web es aún joven es más vulnerable a que Google cometa esos fallos. A mayor PageRank tenga tu dominio y la página concreta donde publicaste el post menor será el riesgo de que la copia suplante al original en la página de resultados de Google.

Esto es así porque Google, entre otras señales, se sirve del PR del dominio y de la página para distinguir el original de las copias. Esta señal tiene su sentido pues normalmente el recién llegado es quien copia contenidos de páginas ya establecidas. Lamentablemente eso no siempre es así y le toca pagar el pato al recién llegado que le han robado su contenido.

Pero ¿cómo lo sabemos si alguien nos ha plagiado y qué podemos hacer de ser así? Paso a paso, veamos primero cómo detectarlo.

Copyscape: la forma más rápida y fiable de detectar el plagio en Internet

Para detectar el plagio de tus contenidos puedes buscar tus artículos uno por uno en Google y ver si aparecen otros resultados indexados que son copias; o bien puedes usar Copyscape y dejar que la máquina lo haga por ti.

(Vídeo presentación de Copyscape)

Copyscape es una herramienta online que te ayuda a descubrir de una forma rápida y fiable si alguien a plagiado tu contenido.

Tiene una versión gratis y una de pago. En la gratuita te permite buscar una a una las páginas que quieras comprobar si han sido plagiadas.

Copyscape Premium, en cambio, es de pago y cuesta 10 centavos de dólar cada búsqueda (más o menos 0,075 euros). Te ofrece una detección más potente, que la opción gratuita, de contenidos plagiados.

Además, y esto es importante, con Copyscape Premium puedes copiar textos y pegarlos en una cajita y buscar si se trata de un contenido duplicado u original.

Esto es interesante porque te permite saber de antemano si el contenido que vas a publicar en tu blog puede ser identificado como duplicado por Google o no.

Aquí estoy pensando en dos situaciones:

1. Si otro produce contenidos para tu página web. Pongamos que pagas a alguien para que produzca contenidos para el blog de tu Web. ¿Cómo saber si el contenido es original o es una copia o refrito mal hecho de otro post sacado de la Red?

2. Si tú mismo produces el contenido pero te sirves para ello de otras fuentes que encuentras en la Red.

Si Google considera tu contenido duplicado no tan sólo corres el riesgo de que lo filtre y no aparezca en la página de resultados (o incluso que ni se indexe) sino que en los casos más graves puedes incluso ser penalizado.

Hay algunas penalizaciones que están relacionadas con la idea de tener el mismo contenido que otro sitio – por ejemplo, si tú estás copiando “scraping” contenido de otros sitios y publicándolo, o si lo publicas sin añadir ningún valor adicional. Estas tácticas están claramente esbozadas (y desaconsejadas) en nuestras directrices para Webmasters”. (Traducción suplida). Susan Moskwa, Webmaster Trends Analyst.

Pero esto era antes de los cambios de Google Panda, ahora (desde febrero de 2011) la cosa es aún más seria. Ahora tener contenidos duplicados en tu página web deja de ser un problema aislado de la página que contiene el contenido duplicado y afecta a todo tu sitio web. Es decir, que otras páginas de tu sitio web, que no tienen contenidos duplicados, pueden perder posiciones en la página de resultados de Google o incluso desaparecer del índice.

Para evitar publicar esos contenidos duplicados en tu blog tienes a tu disposición Copyscape.

Copysentry, otro servicio de Copyscape, se encarga de escanear tu web cada día o semanalmente y te manda un email cuando encuentra que se han hecho nuevas copias de tu contenido.

Además, Copyscape ofrece unos banners que puedes poner en tu web para alertar a los potenciales plagiadores que visiten tu página con malas intenciones de que tu sitio está siendo controlado y que no permites que te roben el contenido.

Prevenir y combatir el plagio

Es imposible evitar que te plagien pero sí que puedes tomar ciertas medidas para prevenirlo y para tratar de combatirlo:

1. Coloca en el footer de tu página web un banner de alerta contra el plagio.

2. Incluye en el footer de tu página web: © tupáginaweb.com Todos los derechos reservados. Para añadir el símbolo en HTML tienes que usar: ©

3. Utiliza Copyscape en su versión gratuita o de pago (Copysentry) para detectar las copias ilegales de tu contenido.

4. Si a pesar de ello han copiado tu contenido deberías ponerte en contacto con quien te ha plagiado y pedirle que elimine su entrada y que no vuelva a hacerlo en el futuro.

La mayoría de gente accede a quitarla pues no les conviene que la cosa vaya a mayores. Si a pesar de ello no borran la entrada copiada dile que notificarás del abuso a su proveedor de hosting (lo averiguarás aquí Whois) y a Google a través de un spam report. Si el tema es serio habla con tu abogado para que te explique otras opciones. Confío en que no tengas nunca que llegar a esos extremos.

Espero que te sirva esta herramienta. A mí me parece muy útil, ya no tanto para detectar el plagio ajeno (que también) sino sobre todo para saber si los contenidos que produces tú mismo (u otro a quien le has encomendado la tarea) son copias o no.

Si externalizas la producción de contenidos esta es una herramienta que merece la pena probar.

¿Qué opinas? ¿Es el plagio de contenidos un problema o no es para tanto? Me gustaría conocer tu opinión al respecto.

Comparte este post en Twitter y Facebook si te ha sido útil. Gracias!

15 Responses to Copyscape: Descubre y Combate el Plagio de tus Contenidos en Internet
  1. Bitacoras.com
    December 14, 2011 | 5:36 am

    Información Bitacoras.com…

    Valora en Bitacoras.com: El plagio en internet es cosa común. Cualquier persona puede copiar tu contenido, pegarlo en su web diciendo que es suyo y monetizarlo con la publicidad que tiene esparcida en la página. De hecho, hay páginas web, conocida……

  2. Daniel Visedo LorenzoNo Gravatar
    December 14, 2011 | 10:19 am

    muy buen post david, muchas gracias por la info.

  3. Sr IntelligeniusNo Gravatar
    December 15, 2011 | 2:08 pm

    Lo del plagio y llegar a poner una demanda me parece una exageración, tus ideas y las escribas en un blog me parecen que las ideas no tiene copyright, Yo tengo un blog y si esas ideas le sirven de inspiración a otro para agregar más información o complementarlo, para criticarlo e incluso copiarlo así nada más lo pueden hacer. Así se me ocurre una idea seguro que a muchas miles de personas también. No somos tan originales muchas veces como creemos, en el mundo hay 7000 millones de personas unas más listas que otras. Lo que pasa que la competencia por un pedazo de tarta del mercado y creernos que somos únicos esa es el hambre del copyright o del plagio. No somos tan especiales como creemos ni tan únicos como pensamos. La mayoría somos comunes y corrientes y si una idea le sirve para que otra se sienta mejor o le ayuda entonces copy y paste. Sr Intelligenius.

    • David CantoneNo Gravatar
      December 16, 2011 | 7:17 pm

      Hola. Eso ya depende de cada uno. Tú puedes sentirte bien si alguien te copia palabra por palabra tu contenido, ni siquiera dice que lo leyó de ti, se beneficia económicamente de ello y además te perjudica el posicionamiento de tu entrada. Yo conozco casos de gente perdiendo dinero por culpa de plagiadores que lo único que quieren es lucrarse del esfuerzo ajeno. Eso no parece justo.

      Como digo, eso depende de la situación y de los principios de cada uno. Si no te importa el plagio puedes liberar tus contenidos de derechos de autor, como hizo Leo Babauta. Pero igual de respetable es eso como el que se reserva todos los derechos sobre sus contenidos. Dicho lo cual, si alguien perjudica tu negocio con una actividad ilegal y no cesa ante tus reclamaciones, la via judicial puede ser oportuna. Habría que considerar el caso concreto y ver la magnitud del daño causado.

      Un saludo y gracias por participar con tu punto de vista. Es un tema que se presta al debate.

  4. Daniel Costa LerenaNo Gravatar
    December 21, 2011 | 8:58 am

    David, coincido contigo, el beneficiarse del trabajo y el esfuerzo del otro no lo considero justo.

    El plagio lamentablemente es un recurso por muchos utilizados, principalmente en internet. Por otro lado coincido con Sr Intelligenius en que la originalidad es algo complicada de encontrar, aunque bien podemos citar debidamente las fuentes, cosa que en el ámbito académico es algo normal de hacer. Es de bien nacidos el ser agradecidos y, entiendo en lo personal, que el citar una fuente lejos de desmerecernos nos muestra como personas respetuosas del trabajo de los demás.

    Un punto interesante que mencionas David es el de las licencias; en mi caso las publicaciones del blog son de libre distribución, pues así lo consideré oportuno al momento de registrar el contenido. Simplemente pido que se me cite o, cuando menos, se coloque un enlace a la fuente original. Incluso cuando publico artículos en otros medios digitales, posteriormente los cuelgo en mi blog y coloco en enlace a la publicación original, insisto, de mi propio articulo.

    También coincido contigo David que éste es un tema que se presta a debate, ahora, el punto es que debatir las ideas es un ejercicio más que saludable, por lo tanto gracias por ponerlo sobre la mesa.
    Un tema ciertamente muy subjetivo y del cual cada uno toma partido en base a sus propios intereses.

    Un saludo y mis mejores deseos para todos.

  5. demonNo Gravatar
    January 12, 2012 | 9:25 am

    Buen artículo! Voy a utilizar el copyscape para ver si alguien copia mi contenido o mis autores lo hacen..una de dos :)

  6. maxNo Gravatar
    November 6, 2012 | 2:38 pm

    la herramienta es maravillosa,gracias a ella descubri un sitio donde me clonaron 2 subpaginas de mi web, y encima para descargar el contenido de mis dos paginas robadas por el, pedia dinero via pay pall,se lo hice saber al que me plagio ,que lo denunciaria y elimino las 2 subpagias que me habia facchado,despues de esto,utilizo esta herramienta,todas las semanas,pues aun quedan gente con mucha cara.Es muy necesaria

  7. IbanNo Gravatar
    January 5, 2013 | 3:05 pm

    Muy buena herramienta, gracias por la info.

  8. David GarcíaNo Gravatar
    December 8, 2013 | 4:36 pm

    Hola David,

    Muchas gracias por el post. Muy útil, ya que desafortunadamente existen muchos farsantes que se dedican a copiar en Internet y a mostrar el contenido en sus webs como si fuese suyo.

    Mi pregunta es ¿qué medidas se pueden tomar contra alguien que parafrasee todo un post de tal manera que Google no lo detecte? Me he encontrado más de un caso así…

  9. AlfonsoNo Gravatar
    December 18, 2013 | 10:18 am

    Hola David,

    Pues sí, se me acaban de copiar carácter a carácter una entrada de un blog. Este es el original:
    http://viviendo20.wordpress.com/2013/12/12/la-nata-del-capuccino-reflexion-sobre-el-precio-de-los-productos/

    Y esta es la copia (que ha copiado el html completito):

    [link eliminado - editado]

    Sin embargo, el whois me da:

    % NOTE: The registry for this domain name does not publish ownership
    % records (whois records) in the standard format. This data
    % represents the most likely status of the domain based on
    % information provided by the Internet’s domain name servers (DNS).

    domain: market-ing.es
    status: taken
    nameserver: dns105.ovh.net
    nameserver: ns105.ovh.net

    ¿Alguna idea?

    • David CantoneNo Gravatar
      January 1, 2014 | 6:57 pm

      Hola Alfonso,

      Te comento…

      Lo mejor es la solución amistosa: tú le pides que lo borre y él o ella lo borra.

      El problema es que a veces no se conoce su email porque lo oculta o bien no responde.

      En ese caso debes descubrir quien le registró el dominio y hacerles la queja a ellos denunciando lo sucedido con su cliente.

      Si eso no funciona, lo puedes denunciar a Google, para que desindexe su entrada en Google, lo que significa a efectos prácticos que nadie o casi nadie la va a ver nunca. Esta opción se recomienda para casos repetidos y que producen un perjuicio demostrable.

      También puedes ir a un abogado, para que proceda por ti, y en casos graves a los tribunales.

      He seguido el enlace de la página infractora y parece que han suspendido su cuenta, así que en principio se ha resulto el problema solo, con lo cual te ahorras lo arriba comentado.

      He editado el link eliminándolo porque a parte de que ya no hay nada al otro lado, prefiero no enlazar a páginas de este tipo, pues lo único que faltaba era darles promoción por su conducta negativa.

      Por cierto, en tu post he visto que haces un comentario de que no estás de acuerdo que poner la indicación de “todos los derechos reservados” ayude. Ya sabemos que no es necesario indicarlo para que tu contenido se considere protegido por los derechos de propiedad intelectual, pero sinceramente, como funciona internet, nunca está de más ponerlo, precisamente para intentar disuadir comportamientos del tipo aquí comentado.

      Ponerlo o no ya decide cada uno. La practica generalizada de los grandes blogs es indicar qué tipo de derechos tiene el propietario del blog con los contenidos que se publican, ya sean todos o algunos, como pasa en las opciones de Creative Commons.

      Un saludo,

  10. Alfonso TiendaNo Gravatar
    January 2, 2014 | 7:12 pm

    Hola David,

    Ante todo gracias por la respuesta. Como comenté, no pude encontrar información sobre el registro del dominio (no sé realmente cómo se puede hacer esto), pero como comentas la cuenta ha sido suspendida. :). Desde luego, se lo merece, porque se dedicaba a piratear todo.

    Gracias por lo de Google, la próxima vez lo hare!

    Un abrazo.

    Alfonso

  11. luisNo Gravatar
    February 20, 2014 | 1:32 am

    DAVID gracias por la información q compartes y me ha sido de mucho interés y seguiré mirando tus paginas ,me educo de forma fácil y amena ,ATENTAMENTE LUIS.

Leave a Reply

Wanting to leave an <em>phasis on your comment?

Trackback URL http://davidcantone.com/plagio-en-internet/trackback/