3 maneras en que puedes eliminar páginas de blog no deseadas de Google

¿Es usted un creyente en la idea de que una vez que algo se publica en Internet, se publica para siempre? Bueno, hoy vamos a disipar ese mito..

La verdad es que en muchos casos es bastante posible erradicar la información de Internet. Claro, hay un registro de páginas web que se han eliminado si buscas en la Máquina Wayback, ¿verdad? Sí, absolutamente. En la Máquina Wayback hay registros de páginas web que se remontan a muchos años, páginas que no encontrará en una búsqueda de Google porque la página web ya no existe. Alguien lo borró, o el sitio web se cerró.

Entonces, no hay forma de evitarlo, ¿verdad? La información se grabará para siempre en la piedra de Internet, para que las generaciones la vean. Bueno no exactamente.

La verdad es que si bien puede ser difícil o imposible eliminar las noticias importantes que han proliferado de un sitio web o blog de noticias a otro como un virus, en realidad es bastante fácil erradicar por completo una página web o varias páginas web de todos los registros. de existencia: para eliminar esa página para los motores de búsqueda y para la Máquina Wayback La nueva Máquina Wayback le permite viajar visualmente en el tiempo de Internet La nueva Máquina Wayback le permite viajar visualmente en el tiempo de Internet Parece que desde el lanzamiento de la Máquina Wayback en En 2001, los propietarios del sitio decidieron deshacerse del back-end basado en Alexa y rediseñarlo con su propio código de código abierto. Después de realizar pruebas con el ... Leer más. Hay una trampa, por supuesto, pero llegaremos a eso..

3 maneras de eliminar páginas de blogs de la red

El primer método es el que utilizan la mayoría de los propietarios de sitios web, porque no conocen nada mejor, simplemente eliminando páginas web. Esto puede suceder porque te has dado cuenta de que tienes contenido duplicado en tu sitio o porque tienes una página que no deseas que aparezca en los resultados de búsqueda..

Simplemente elimine la página

El problema con la eliminación total de páginas de su sitio web es que, dado que ya ha establecido la página en la red, es probable que haya enlaces desde su propio sitio así como enlaces externos desde otros sitios a esa página en particular. Cuando lo eliminas, Google reconoce de inmediato esa página tuya como una página que falta..

Por lo tanto, al eliminar su página no solo ha creado un problema con “Extraviado” rastrea los errores por ti mismo, pero también has creado un problema para cualquiera que alguna vez haya vinculado a la página. Por lo general, los usuarios que acceden a su sitio desde uno de esos enlaces externos verán su página 404, lo cual no es un problema importante, si utiliza algo como el código 404 personalizado de Google para brindar sugerencias útiles o alternativas a los usuarios. Pero, usted pensaría que podría haber formas más elegantes de eliminar páginas de los resultados de búsqueda sin tener que activar todos esos 404 para enlaces entrantes existentes, ¿verdad??

Bueno, hay.

Eliminar una página de los resultados de búsqueda de Google

En primer lugar, debe comprender que si la página web que desea eliminar de los resultados de búsqueda de Google no es una página de su propio sitio, entonces no tendrá suerte a menos que existan razones legales o si el sitio ha publicado su información personal. Información en línea sin su permiso. Si ese es el caso, entonces use el solucionador de problemas de eliminación de Google para enviar una solicitud para que la página se elimine de los resultados de búsqueda. Si tiene un caso válido, es posible que tenga éxito con la eliminación de la página; por supuesto, puede tener un éxito aún mayor simplemente contactando al propietario del sitio web Cómo eliminar información personal falsa en Internet Cómo eliminar información personal falsa en Internet Leer más Como describí cómo hacerlo en 2009.

Ahora, si la página que desea eliminar de los resultados de búsqueda está en su propio sitio, está de suerte. Todo lo que necesitas hacer es crear un robots.txt Archivo y asegúrese de que ha rechazado la página específica que no desea en los resultados de búsqueda o el directorio completo con el contenido que no desea que se indexe. Esto es lo que parece bloquear una sola página.

User-agent: * No permitir: /my-deleted-article-that-i-want-removed.html

Puede impedir que los robots rastreen directorios completos de su sitio de la siguiente manera.

User-agent: * No permitir: / content-about-personal-stuff /

Google tiene una excelente página de asistencia que puede ayudarlo a crear un archivo robots.txt si nunca ha creado uno antes. Esto funciona extremadamente bien, como expliqué recientemente en un artículo sobre cómo estructurar acuerdos de sindicación Cómo negociar acuerdos de sindicación y proteger sus rankings de búsqueda Cómo negociar acuerdos de sindicación y proteger sus rankings de búsqueda Sindicar está de moda en estos días. ¡Pero de repente, podría encontrar que el socio de sindicación aparece más arriba que usted en los resultados de búsqueda de una historia que escribió originalmente! Protege tus rankings de búsqueda. Lea más para que no le hagan daño (pida a los socios de sindicación que rechacen la indexación de sus páginas en las que está sindicado). Una vez que mi propio socio de sindicación aceptó hacer esto, las páginas que contenían contenido duplicado de mi blog desaparecieron por completo de las listas de búsqueda..

Solo el sitio web principal aparece en el tercer lugar de la página donde se enumera nuestro título, pero mi blog ahora aparece en el primer y segundo lugar; algo que hubiera sido casi imposible si un sitio web de autoridad superior hubiera dejado la página duplicada indexada.

Lo que muchas personas no se dan cuenta es que esto también es posible de lograr con Internet Archive (la Máquina de Wayback) también. Aquí están las líneas que necesita agregar a su archivo robots.txt para que esto suceda.

User-agent: ia_archiver Disallow: / sample-category /

En este ejemplo, le digo a Internet Archive que elimine cualquier cosa en el subdirectorio de categoría de muestra en mi sitio de la Máquina de Wayback. El archivo de Internet explica cómo hacerlo en su página de ayuda de Exclusión. Aquí es también donde explican eso. “El archivo de Internet no está interesado en ofrecer acceso a sitios web u otros documentos de Internet cuyos autores no desean que sus materiales estén en la colección..”

Esto va en contra de la creencia común de que todo lo publicado en Internet se arrastra en el archivo por toda la eternidad. No, los webmasters que poseen el contenido pueden eliminar el contenido del archivo utilizando el enfoque de robots.txt..

Eliminar una página individual con etiquetas meta

Si solo tiene unas pocas páginas individuales que desea eliminar de los resultados de la Búsqueda de Google, en realidad no tiene que utilizar el método robots.txt, simplemente puede agregar el “robots” etiqueta meta para las páginas individuales, e indique a los robots que no indexen o sigan los enlaces en toda la página.

Podrías usar el “robots” meta anterior para evitar que los robots indexen la página, o específicamente podría decirle al robot de Google que no indexe, por lo que la página solo se elimina de los resultados de búsqueda de Google, y otros robots de búsqueda aún podrían acceder al contenido de la página.

Depende completamente de usted cómo desea administrar lo que hacen los robots con la página y si la página aparece o no en la lista. Para unas pocas páginas individuales, este puede ser el mejor enfoque. Para eliminar un directorio completo de contenido, vaya con el método robots.txt.

La idea de “Removiendo” Contenido

Este tipo de vueltas a toda la noción de “borrando contenido de internet” En su cabeza. Técnicamente, si elimina todos sus propios enlaces a una página de su sitio y lo elimina de la Búsqueda de Google y el Archivo de Internet utilizando la técnica de robots.txt, la página es para todos los propósitos y propósitos “eliminado” desde Internet. Sin embargo, lo interesante es que si existen enlaces a la página, esos enlaces seguirán funcionando y no se activarán los errores 404 para esos visitantes..

Es un mas “amable” enfoque para eliminar contenido de Internet sin desordenar completamente la popularidad de los enlaces existentes en su sitio a través de Internet. Al final, la forma en que gestione el contenido que recopilan los motores de búsqueda y el Internet Archive depende de usted, pero siempre recuerde que a pesar de lo que diga la gente sobre la vida útil de las cosas que se publican en línea, todo está totalmente bajo su control..

Explore más acerca de: Google, Búsqueda de Google, SEO, Diseño web, Herramientas para webmasters.

« 3 maneras en que puedes conservar tu presencia en línea mientras estás en la cárcel 3 formas en que puedes ejecutar juegos y aplicaciones de MS-DOS en Linux »