Guía para principiantes para evitar el raspado del contenido del blog en WordPress

Guía para principiantes para evitar el raspado del contenido del blog en WordPress / Guía para principiantes

Si escribe contenido original día tras día, ya está consciente del hecho de que sus publicaciones terminarán en un montón de sitios de SPAM en unos pocos días, a veces incluso en unos pocos minutos. Algunos usuarios incluso notaron que el sitio con contenido robado superó a la publicación original. Es muy frustrante como propietario de un sitio web ver que alguien está robando tu contenido sin permiso, monetizándolo, superándote en SERPs y robando a tu audiencia. El raspado de contenido es un gran problema en estos días, ya que es muy fácil para alguien robar su contenido. En este artículo, cubriremos qué es el raspado de contenido del blog, cómo capturar raspadores de contenido, cómo tratar los raspadores de contenido, cómo puede reducir y prevenir el raspado de contenido, cómo aprovechar el raspado de contenido, cómo ganar dinero con los raspadores de contenido. , y el contenido es bueno raspando siempre?

¿Qué es el contenido del blog de raspado??

El raspado del contenido del blog es un acto que generalmente se realiza con scripts que extraen el contenido de numerosas fuentes y lo arrastra a un sitio. Ahora es tan fácil que cualquiera puede instalar un sitio de WordPress, poner un tema gratuito o comercial e instalar algunos complementos que irán y rasparán el contenido de los blogs seleccionados, para que pueda publicarse en su sitio..

¿Por qué están robando mi contenido??

Algunos de nuestros usuarios nos han preguntado por qué están robando mi contenido. La respuesta simple es porque eres IMPRESIONANTE. La verdad es que estos raspadores de contenido tienen motivos ulteriores. A continuación, se muestran algunas de las razones por las que alguien rasparía tu contenido:

  • Comisión de afiliados - Hay algunos comerciantes de afiliados sucios por ahí que solo quieren explotar el sistema para ganar unos cuantos dólares extra. Utilizarán su contenido y el contenido de otros para atraer tráfico a su sitio a través del motor de búsqueda. Estos sitios suelen estar dirigidos a un nicho específico, por lo que tienen productos relacionados que están promoviendo..
  • Generación líder - A menudo vemos abogados y agentes de bienes raíces haciendo esto. Quieren parecer líderes de la industria en sus pequeñas comunidades. No tienen el ancho de banda para producir contenido de calidad, por lo que salen y raspan contenido de otras fuentes. A veces, ni siquiera son conscientes de esto porque están pagando $ 30 / mes para agregar contenido y ayudarles a mejorar el SEO. Hemos encontrado bastantes de estos en el pasado.
  • Ingresos por publicidad - Algunas personas solo quieren crear un "centro" de conocimiento. Una ventanilla única para usuarios en un nicho específico. Si tuviera un centavo por cada vez que alguien hiciera esto con nuestro contenido, tendríamos unos pocos cientos de centavos. A menudo notamos que el contenido de nuestro sitio está siendo raspado. El raspador siempre responde, estaba haciendo esto por el bien de la comunidad. Excepto que el sitio está lleno de anuncios..

Estas son solo algunas de las razones por las que alguien robaría tu contenido..

Cómo atrapar los raspadores de contenido?

Capturar los raspadores de contenido es una tarea tediosa y puede llevar mucho tiempo. Hay algunas formas en que puede utilizar para capturar los raspadores de contenido..

Busca en Google con tus títulos de publicaciones

Sí, eso es tan doloroso como parece. Este método probablemente no vale la pena, especialmente si está escribiendo sobre un tema muy popular..

Trackbacks

Si agrega enlaces internos en sus publicaciones, notará un trackback si un sitio roba su contenido. De esta manera, el raspador te dice que están raspando tu contenido. Si está utilizando Akismet, muchos de estos trackbacks se mostrarán en la carpeta SPAM. Nuevamente, esto solo funcionará si tienes enlaces internos en tus publicaciones..

Herramientas para webmasters

Si utiliza las herramientas de webmasters de Google, es probable que conozca los enlaces a la página de su sitio. Si busca en "Tráfico", verá una página que dice Enlaces a su sitio. Es probable que tus raspadores estén entre los mejores. Tendrán cientos si no miles de enlaces a sus páginas (considerando que usted tiene enlaces internos).

FeedBurner Uncommon Uses

Si ha configurado Feedburner para su blog de WordPress, entonces puede ver algunos usos poco comunes. En la pestaña Analizar, debajo de Estadísticas de alimentación, verá "Usos no comunes". Allí verás una lista de sitios..

Cómo lidiar con los raspadores de contenido

Hay pocos enfoques que las personas toman al tratar con los raspadores de contenido. El enfoque de No hacer nada, Matarlos a todos, Aprovecharlos de ellos..

El enfoque de no hacer nada

Este es, con mucho, el enfoque más fácil que puede tomar. Por lo general, los bloggers más populares recomendarían esto porque lleva MUCHO tiempo luchar contra los raspadores. Este enfoque simplemente recomienda que "en lugar de luchar contra ellos, dedique su tiempo a producir más contenido de calidad y diviértase". Ahora, obviamente, si se trata de un blog conocido como Smashing Magazine, CSS-Tricks, Problogger u otros, entonces no tienen que preocuparse por eso. Son sitios de autoridad a los ojos de Google..

Sin embargo, durante la actualización de Panda, sabemos que algunos buenos sitios se marcaron como raspadores porque Google pensó que sus raspadores eran contenido original. Así que este enfoque no siempre es el mejor en nuestra opinión.

Mátalos a todos.

El opuesto exacto del "Enfoque de Nada". En este enfoque, simplemente póngase en contacto con el raspador y pídales que eliminen el contenido. Si se niegan a hacerlo o simplemente no responden a sus solicitudes, debe presentar un DMCA (Digital Millennium Copyright Act) con su anfitrión. En nuestra experiencia, la mayoría de los sitios web de raspado no tienen un formulario de contacto disponible. Si lo hacen, entonces utilízalo. Si no tienen el formulario de contacto, entonces debe hacer una búsqueda Whois.

Puedes ver la información de contacto en el contacto administrativo. Por lo general, el contacto administrativo y técnico es el mismo. El whois también muestra el registrador de dominios. Las empresas de alojamiento web más conocidas y los registradores de dominios tienen formularios DMCA o correos electrónicos. Puedes ver que esta persona específica está con Hostgator debido a sus servidores de nombres. HostGator tiene un formulario para quejas de DMCA. Si el servidor de nombres es algo así como ns1.theirdomain.com, entonces tienes que profundizar más haciendo búsquedas de IP inversas y buscando IPs.

También puede usar un servicio de terceros para DMCA.com para desmontes.

Jeff Starr en su artículo sugiere que deberías bloquear las IP del malo. Acceda a sus registros para obtener su dirección IP y luego bloquéelos con algo como esto en su archivo raíz .htaccess:

Negar desde 123.456.789

También puede redirigirlos a un feed ficticio haciendo algo como esto:

RewriteCond% REMOTE_ADDR 123 \ .456 \ .789 \. RewriteRule. * Http://dummyfeed.com/feed [R, L]

Puedes ser realmente creativo aquí como sugiere Jeff. Envíelos a fuentes de texto realmente grandes llenas con Lorem Ipsum. Puedes enviarles algunas imágenes repugnantes de cosas malas. También puede enviarlos de vuelta a su propio servidor y provocar un bucle infinito que bloqueará su sitio..

El último enfoque que tomamos es aprovecharlos..

Cómo aprovechar los raspadores de contenido

Este es nuestro enfoque de tratar con los raspadores de contenido, y resulta bastante bien. Ayuda a nuestro SEO y nos ayuda a ganar dinero extra. La mayoría de los raspadores utilizan su RSS para robar su contenido. Así que estas son algunas de las cosas que puedes hacer:

  • Enlace interno - Debes vincular el CRAP de tus publicaciones. Con la función de enlace interno en WordPress 3.1, ahora es más fácil que nunca. Cuando tiene enlaces internos en su artículo, le ayuda a aumentar las visitas de página y reducir la tasa de rebote en su propio sitio. En segundo lugar, obtiene vínculos de retroceso de las personas que están robando su contenido. Por último, te permite robar a su audiencia. Si eres un blogger talentoso, entonces entiendes el arte de la vinculación interna. Tienes que colocar tus enlaces en palabras clave interesantes. Haz que sea tentador para el usuario hacer clic en él. Si haces eso, entonces la audiencia del raspador también hará clic en él. De esa manera, usted sacó a un visitante de su sitio y lo trajo de vuelta a donde debería haber estado en primer lugar..
  • Palabras clave de enlace automático con enlaces de afiliados - Hay pocos complementos como Ninja Affiliate y SEO Smart Links que reemplazarán automáticamente las palabras clave asignadas con enlaces de afiliados. Por ejemplo: HostGator, StudioPress, MaxCDN, Gravity Forms << These all will be auto-replaced with affiliate links when this post goes live.
  • Sé creativo con el pie de página RSS - Puede usar el pie de página RSS o WordPress SEO de Yoast Plugin para agregar elementos personalizados a su pie de página RSS. Puedes agregar cualquier cosa que quieras aquí. Conocemos a algunas personas que les gusta promocionar sus propios productos a sus lectores de RSS. Así que agregarán pancartas. Adivina qué, ahora esos banners también aparecerán en el sitio web de estos raspadores. En nuestro caso, siempre agregamos un poco de exención de responsabilidad en la parte inferior de nuestras publicaciones en nuestros canales RSS. Simplemente se lee como "Cómo colocar su sitio de WordPress en estado de solo lectura para las migraciones y el mantenimiento del sitio es una publicación de: WPBeginner que no se puede copiar en otros sitios". Al hacer esto, obtenemos un vínculo de retroceso al artículo original. desde el sitio de Scraper que le permite a Google y otros motores de búsqueda saber que somos una autoridad. También les permite a sus usuarios saber que el sitio está robando nuestro contenido. Si eres bueno con los códigos, entonces puedes obtener totalmente nueces. Como agregar publicaciones relacionadas solo para tus lectores de RSS y muchas otras cosas. Echa un vistazo a nuestra guía para manipular completamente tu fuente RSS de WordPress..

Cómo puede reducir el contenido del blog y posiblemente evitarlo

Teniendo en cuenta si utiliza nuestro enfoque de gran cantidad de enlaces internos, agregue enlaces de afiliados, rss banners y es muy probable que reduzca el contenido raspado. Si acepta la sugerencia de Jeff Starr de redirigir los raspadores de contenido, eso también detendrá a esos raspadores. Aparte de lo que hemos compartido anteriormente, hay algunos otros trucos que puedes usar.

Fuente RSS completa vs. resumen

Ha habido un debate en la comunidad de blogs sobre si se debe tener un feed RSS completo o un feed RSS de resumen. No vamos a entrar en muchos detalles sobre ese debate, sin embargo, uno de los PROS de tener un feed RSS de resumen único es que evita el raspado de contenido. Puede cambiar la configuración yendo a su panel de administración de WordPress y yendo a Configuración »Lectura. Luego, cambie la configuración de cada artículo en un feed: resumen.

Nota: tenemos un feed completo porque nos preocupamos más por nuestros lectores RSS que por los spammers..

SPAM trackback

Trackbacks y Pingbacks definitivamente tuvieron grandes usos, sin embargo, ahora están siendo abusados ​​constantemente. A menudo, los temas muestran trackbacks y pingbacks debajo o entre los comentarios. Esto le da al spammer un incentivo para raspar su sitio y enviar trackbacks. Si lo aprueba por error, obtienen un vínculo de retroceso y una mención de su sitio. Aquí es cómo puede deshabilitar Trackbacks en todas las publicaciones futuras. Aquí hay un artículo que le mostrará cómo deshabilitar los trackbacks y los pings en las publicaciones existentes de WordPress también..

¿Es bueno raspar el contenido??

Puede ser. Si ve que está ganando dinero con el sitio del raspador, entonces puede estar seguro. Si ve mucho tráfico desde el sitio de un raspador, entonces puede ser. En la mayoría de los casos, sin embargo, no lo es. Siempre debes tratar de sacar tu contenido. Pero se dará cuenta de que a medida que su blog crezca, es casi imposible realizar un seguimiento de todos los raspadores de contenido. Todavía enviamos quejas de DMCA, sin embargo, sabemos que hay muchos otros sitios que están robando nuestro contenido y que no podemos mantenernos al tanto.

¿Cuáles son tus pensamientos? ¿Utiliza alguna otra mecánica para evitar el raspado del contenido? Me encantaría conocer tu opinión.