Feedly estaba robando su contenido aquí está la historia y su código

Feedly estaba robando su contenido aquí está la historia y su código / Internet

La semana pasada, Feedly lanzó una nueva polémica “característica” - secuestrando enlaces de alimentación para robar el tráfico de millones de bloggers.

La redirección de enlaces compartidos con la propia vista de Feedly a Feedly del artículo en lugar del artículo en sí mismo en el sitio original es una preocupación para los creadores de contenido original en muchos blogs. No solo resulta en la pérdida de tráfico, sino que también es engañoso para quienes siguen un blog en particular..

Aquí está la historia completa de por qué las personas están enojadas y cómo un blogger ayudó a corregir la situación. También profundizo en su código fuente para mostrarte cuán sucios son sus pequeños trucos.

Crédito adeudado: The Digital Reader fue la fuente original de esta noticia: simplemente decidí investigar un poco más y ver exactamente lo que estaban haciendo..

En primer lugar, la buena noticia.

En el momento de redactar este informe, el comportamiento se corrigió de manera que los enlaces de Feedly acortados se envían al sitio de los creadores, pero se realiza un examen rápido del código de estado HTTP Los 10 sitios web principales para códigos de error y solución de problemas Los 10 sitios web principales para códigos de error y La Solución de problemas de Lectura Más reveló que la redirección no se estaba realizando en el nivel típico del servidor con una redirección 301 o 302 (200, que Feedly está enviando, significa “Sí, tenemos esa página, espera”; 404 significa “extraviado”; 301 significa “Redirigir permanentemente a otra URL; mientras que 302 significa “redirección temporal”).

Esto significaba que la redirección se estaba realizando en JavaScript, así que quería saber más. Usando una herramienta de recuperación de página web de línea de comandos llamada curl, pude obtener el código fuente de un enlace de Feedly de muestra a Techmeme.com antes de que se produjera la redirección (ya que CURL no ejecutará JavaScript), y reveló algunos datos sorprendentes. Esto es lo que encontré.

(He subido la fuente completa aquí si te gustaría echarle un vistazo. A continuación, solo presento algunos fragmentos interesantes a continuación)

Algunas personas estaban preocupadas por las implicaciones de SEO de básicamente que su contenido fuera robado y reeditado en otro lugar; la buena noticia es que Feedly configuró correctamente el rel =“canónico” etiqueta meta para indicar a Google que todos los valores de enlace deben pasarse al sitio original. Sin embargo, es imposible determinar si esto se agregó después de que comenzaron las quejas o estuvo presente desde el principio.

  

Están despojando anuncios

En lo que probablemente fue un intento equivocado de duplicar una funcionalidad de tipo de legibilidad 6 Bookmarklets que aumentarán la productividad y la velocidad de navegación por la web 6 Bookmarklets que aumentarán la velocidad y la productividad de la navegación por la web Los Bookmarklets son pequeños ayudantes sospechosos que se encuentran en la barra de marcadores de su navegador. A diferencia de sus marcadores normales, no archivan una URL, en lugar de los marcadores son pequeños applets de Java con una función de un solo clic. Hay cientos de ... Leer más, lo que hace que una página quede reducida a lo esencial, Feedly eliminó toda la publicidad, el seguimiento y los botones de redes sociales que pueden haberse incrustado en el elemento de feed original. Aquí está la lista completa de cosas que están siendo eliminadas:

 var visualExcludePatterns = ["feedproxy", "feedburner", "/ ~", "feeds.wordpress.com", "stats.wordpress.com", "googleadservices.com", "feedads", "tweet-this", " fmpub "," - ads "," _ ads "," pheedo "," zemanta "," u.npr.org/iserver","openx.org","slashdot-it","smilies","/ico- "," commindo-media.de "," creatives.commindo-media "," doubleclick.net "," i.techcrunch "," adview "," / feed.gif ",". ads. "," / avw .php”,"wp-digg-this", "feed-injector", "/ plugins /", "tweetmeme.com", "_ icon _", "/ ad -", "share-buttons", "feedsportal.com", "buysellads "," holstee "," musictapp "," / ad _ "," / button / "," donate.png "," / sponsors / "," googlesyndication.com "," / pagead "," / adx "," activo / feed-fb "," activo / feed-tw "," feedburner.com/~ff","gstatic.com","feedsportal.com "]; 

Sacando un “donar” El botón parece particularmente irritante, por alguna razón..

Están secuestrando enlaces

Aquí llegamos al punto más serio, ya que no solo Feedly raspó el contenido de su sitio, sino que luego eliminó todos los botones sociales originales y reescribió los metadatos. Esto significa que cuando alguien posteriormente compartió el artículo, de hecho sería compartiendo el enlace de Feedly y no la publicación original. Cualquiera que haga clic en ese enlace irá directamente a Feedly.

Captura de pantalla del contenido raspado de TheDigitalReader

Entonces, ¿qué, usted podría preguntar? Cuando una publicación se vuelve viral, puede ser de gran beneficio para el sitio en cuestión: aumentar las visitas a las páginas y los ingresos de los anuncios y ampliar su audiencia. Feedly estaba robando ese beneficio específico fuera del sitio para expandir su propia base de usuarios. El código de Feedly incluía comprobaciones para dispositivos móviles que dirigirían a los usuarios a la página de la tienda de aplicaciones correspondiente.

 acción de la función (donde) var actionName = "follow"; var url = "http://feedly.com/#" + encodeURIComponent ("abono /" + feedInfo.id); if (/iPhone|iPad/i.test (navigator.userAgent)) actionName = "install"; url = "http://itunes.apple.com/us/app/feedly/id396069556";  else if (/android/i.test (navigator.userAgent)) actionName = "install"; url = "market: // details? id = com.devhd.feedly";  _gaq.push (['_trackEvent', bucket (), actionName + "." + where, feedInfo.id]); window.setTimeout (function () document.location.href = url;, 20); window.event.cancelBubble = true window.event.stopPropagation (); window.event.preventDefault (); 

No fue “Simplemente haciendo el artículo más fácil de ver” - Estaba robando el tráfico, simple y llanamente. Eso no es realmente genial.

Su primer arreglo: una lista de exclusión codificada

Cuando The Digital Reader se quejó por primera vez con Feedly, su respuesta fue volver a codificar el Javascript para incluir un Lista de exclusion. Literalmente agregaron un cheque a cada enlace de Feedly para ver si era un artículo de The Digital Reader y, de ser así, para evitar el secuestro de la página..

 var siteExcludePatterns = ["/ TheDigitalReader /"]; función shouldExcludeSite (url) 

Esta es, por supuesto, una forma absolutamente ridícula de hacerlo, ya que planeaban agregar a esa lista a medida que pasaba el tiempo y más bloggers se quejaban.?

Nate, de The Digital Reader respondió:

¿De dónde salís exigiendo que deje de participar en tu secuestro? Es como decir que debería tener que pedirle a alguien que deje de pegarme en la billetera. Y sin embargo piensas que es razonable.?

Su segunda solución: un truco rápido para omitir todo el código

Después de lo que solo puedo suponer que fue abrumador el número de quejas que siguieron, ajustaron el filtro de secuestro de la siguiente manera:

 if (tipo == "parcial" || shouldExcludeSite ("http://www.techmeme.com/131202/p30#a131202p30") || verdadero) document.body.innerHTML = ""; document.location.href = "http://www.techmeme.com/131202/p30#a131202p30"; 

“Parcial” se refiere a que el contenido raspado es un feed completo o parcial: no tiene sentido secuestrar feeds que solo publiquen un extracto después de todo. Presumiblemente, esta función comenzó como la única comprobación que se produjo al elegir si enviar al usuario al sitio original o no. Después de eso, puede ver el primer arreglo que llama a la función para verificar si este sitio está en la lista de sitios que han optado por no participar; Pero luego vemos su solución final en su lugar. -

 || cierto.

Si tienes alguna experiencia en programación, reconocerás el hackeo rápido que dice “siempre se ejecutará el siguiente código”, y se usa generalmente solo en la depuración. Si cualquiera de esas 3 condiciones es verdadera (las dos primeras ya no importan), Feedly redirige a los usuarios instantáneamente al sitio original.

Y ahí es donde está ahora. Entonces que hemos aprendido?

Básicamente, Feedly se dedicó a crear una especie de experiencia de lectura reducida, pero la forma en que lo hicieron: reescribir los enlaces para propagar su propio servicio a través de las acciones sociales posteriores fue condenadamente repugnante. Esta no es la única decisión incorrecta que Feedly realizó recientemente: el mes pasado, comenzaron a requerir el inicio de sesión con las cuentas de Google+ (después de haber visto lo bien que funciona el inicio de sesión de Google+ para YouTube, la sección de comentarios de YouTube ahora está limpia, cortesía de la sección de comentarios de YouTube de Google+ ahora Limpiado, cortesía de Google+ Google ha limpiado YouTube con un nuevo sistema de comentarios impulsado por Google+. Ahora verá los comentarios más votados, los de personas en sus círculos de Google+ y el propietario del video. Más información. supongo), pero eso también fue revertido rápidamente. La lección es: es posible que desee comenzar a buscar un lector de alimentación alternativo. El final de Google Reader está cerca: prepararse con estos lectores RSS alternativos El final de Google Reader está cerca: prepararse con estos lectores RSS alternativos Google Reader está muerto. Para julio, el principal servicio RSS de Internet se está cerrando para siempre, lo que permite a los usuarios encontrar un reemplazo por su cuenta. Si está buscando un equivalente para Google, estos son solo ... Leer más, a menos que ya haya sido engañado para pagar $ 99 por una cuenta Pro.

Explorar más sobre: ​​Feed Reader, FeedReader, RSS.