Todo lo que siempre quiso saber sobre CAPTCHA, pero tenía miedo de preguntar [Explicación de la tecnología]
Ámalos o odíalos: los CAPTCHA se han vuelto omnipresentes en Internet. ¿Qué es CAPTCHA de todos modos, y de dónde vino? Responsable de la fatiga visual en todo el mundo, el humilde CAPTCHA ha sido el centro de mucha atención como el arma más efectiva en la lucha contra el spam en la web. ¿Pero son eficaces? ¿Hay algún otro tipo de CAPTCHA que no sea el básico? “inclina tu cabeza, entrecierra los ojos y léeme”?
No pasarás (la prueba de Turing)!
Los captcha fueron inventados por un equipo de profesores de Carnegie Mellon y se pusieron en uso por primera vez alrededor de 2000 por AltaVista y Yahoo, en un intento por evitar los bots de chat automatizados y las presentaciones de URL. De hecho, es un acrónimo de dopor completo UNAutilizado PAGUblic Tdurante la prueba para contar docomputadora y Humans UNAparte.
Para aquellos de ustedes que no saben lo que eso significa, puede ser útil explicar qué es la prueba de Turing. Nombrada en honor al profesor británico Alan Turing, la prueba de Turing es la prueba estándar de una Inteligencia artificial máquina basada, por lo que si una máquina puede pasar la prueba, se considera que exhibe comportamiento inteligente. Esencialmente, la prueba implica conversar con varios jueces a través de una interfaz de texto: si los jueces no pueden decir que están chateando con una computadora, ésta pasa la prueba. Personalmente, opino que la prueba de Turing no sirve para nada, ya que un delfín tampoco podría conversar con un humano, pero los atribuimos a una forma superior de comportamiento inteligente. Pero yo divago.
El CAPTCHA por lo tanto, es una prueba automatizada de Turing. Hay varias formas diferentes de hacer esto, pero la más común en la que parece que nos hemos conformado es presentar al usuario una forma de texto aleatorizada, suponiendo (a menudo de manera incorrecta) que cualquier humano normal podrá descifrar el texto.
El CAPTCHA ha evolucionado con el tiempo, pero finalmente ha sido derrotado como veremos más adelante.
CAPTCHAs basados en texto y el proyecto Re-CAPTCHA
El proyecto reCAPTCHA, ahora propiedad de Google, decidió que, en lugar de descifrar inanamente el texto críptico por ningún bien real, presentaba una oportunidad fantástica para corregir las deficiencias del reconocimiento óptico de caracteres basado en computadora. Especialmente para libros más antiguos, a las computadoras les resulta muy difícil reconocer las palabras, mientras que un ser humano considera que las tareas son triviales. Combine la tarea de digitalizar libros antiguos con prevención de spam, y obtendrá un ganador absoluto..
Sin embargo, si la computadora tuvo problemas para reconocer la palabra en primer lugar, ¿cómo puede saber si lo que escribiste es una tontería? Sencillo - presentar al usuario DOS palabras - uno de los cuales es conocido. El sistema asume que si el usuario escribe correctamente la palabra conocida, entonces es probable que la palabra irreconocible también sea correcta.
Otra idea ingeniosa es combinar el CAPTCHA con algún tipo de publicidad..
Problema de matemáticas
De acuerdo, la imagen es una broma, pero esencialmente al usuario se le presenta un problema matemático básico. Usamos un sistema similar en el sitio de respuestas en este momento. No tiene por qué ser difícil, solo una adición básica..
CAPTCHAs basados en imágenes
Tan difícil como algunos de los códigos ReCAPTCHA pueden ser para usted y, a veces, ya se ha desarrollado un software que puede romper el código con una tasa de éxito del 30%, lo que para una campaña de spam con millones de intentos es bastante aceptable. Las imágenes, por otro lado, son extremadamente difíciles de procesar para computadoras semánticamente. Piense en una simple imagen de gato: programar una computadora para reconocer un rostro humano es bastante difícil, pero distinguir un gato de todos los demás animales y objetos del mundo es prácticamente imposible en este momento..
Basado en logica
Estos se basan en la inteligencia lógica y semántica acerca del mundo, o simplemente en el sentido humano común básico. Algunos ejemplos pueden ser:
- Identifique la comida en esta lista: asfalto, tocino, nube, daga.
- Identifica el arma en esta lista: asfalto, tocino, nube, daga..
- ¿Cuántas puertas hay en un carro de cuatro puertas??
- ¿Cuál es la tercera palabra en esta oración??
- ¿Qué queda si eliminas la B de ABC??
Un gran complemento para integrar este tipo de pruebas en su sistema de comentarios de WordPress es WP-Gatekeeper, por cierto.
Servicios De-CAPTCHA
El hecho triste es que si bien los CAPTCHA son un mal necesario, los spammers los superan fácilmente hoy en día. Si bien algunos spammers han desarrollado un software sofisticado que puede imitar el ojo y el cerebro humanos para decodificarlos como lo hace un humano, la verdad es mucho más simple y más horrible. ¿Por qué desarrollar software costoso cuando puedes pagarle a alguien un centavo para que realice el CAPTCHA por ti? La tarifa actual más barata es de $ 1.39 para 1000 CAPTCHA, con una tasa de precisión del 98%, y servicios como Death By Captcha han desarrollado API elaboradas para que los desarrolladores las utilicen. La única persona que se ralentiza por CAPTCHAs hoy en día, eres tú!
El futuro del Captcha
Como todo lo demás en la vida, los CAPTCHA no son impenetrables para la piratería o el spam. A medida que se idean pruebas nuevas y más ingeniosas, se desarrollarán formas cada vez más sofisticadas de romperlas, y la solución de pagarle a alguien más para que las haga por usted nunca puede ser derrotada. Aun así, es nuestra responsabilidad, como desarrolladores web y administradores, mantener a los spammers alejados de nuestros sitios sin degradar la experiencia del usuario..
¿Te sorprende saber cuán barato puede ser derrotado un CAPTCHA? ¿Has visto algún otro tipo de CAPTCHA en la naturaleza que te haya impresionado? Háganos saber en los comentarios! Además, asegúrate de revisar todas las fotos graciosas etiquetadas “captcha” sobre Geeky Fun.
Crédito de la imagen: xkcd
Explorar más sobre: Spam.