Captura de pantalla 2014-07-06 a la(s) 11.18.02

Posted On Julio 21, 2014 By In BLOG, COMUNICACION, MARKETING And 4710 Views

Cómo trabajar para Google, gratisFeatured

Captcha y ReCaptcha o como trabajar para Google, gratis

El spam es algo tan antiguo como la existencia del email e Internet. El spam comenzó con el email y siguió con los newsgroups, sms, motores de búsqueda, wikis, blogs, comentarios en los blogs, agregadores de opinión, foros, teléfonos móviles, social media… El spam nos rodea y amenaza –mucho más que la publicidad- como una nueva forma de pandemia global. Como escribió el sociólogo y urbanista Paul Virilio toda tecnología acarrea en sí misma su propio accidente (la invención del avión el accidente aéreo, la invención de la energía nuclear la bomba atómica y Chernobil o Fukusima). Internet tiene muchos accidentes en sí y, uno de ellos, es el spam. La lucha contra el lado oscuro de los programadores por crear más y nuevas formas de spam se estaba perdiendo a finales de los años 90 debido a los spambots.

En el año 2000 Luis von Ahn, un veinteañero que acababa de terminar sus estudios universitarios, crea Completely Automated Public Turing test to tell Computers and Humans Aparto CAPTCHA. Muchos años antes, en 1950, el británico Alan Turing (1912-1954), matemático, lógico, criptoanalista y pionero de las ciencias computacionales y la Inteligencia Artificial, perseguido durante toda su vida por su homosexualidad, ideó el conocido test de Turing. Idea que serviría a von Ahn para crear Captcha convirtiéndose en un gran Jedi contra el spam, hacerse mundialmente famoso, un doctorado, trabajo en la universidad Carnegie Mellon, reconocimiento como “genio” de la Fundación MacArthur y, de paso, bastante millonario.

El test de Turing (figura 1) consiste en que una máquina sólo puede ser considerada inteligente si en un diálogo con una persona, ésta no es capaz de diferenciar -debido al comportamiento inteligente inferido de las respuestas- si quién le responde es una máquina u otra persona. En nuestro tiempo, es probable que haya muchas personas que no pasen el test de Turing y cada vez más máquinas que sí lo hagan, lo que nos lleva a una paradoja que dudo que Turing llegase a imaginar.

mdf_captcha_1Figura 1.

 Así, Captcha, un simple método para evitar el spam, presentando una imagen difícil de leer (figura 2) pero identificable para una persona -a la que se obliga a escribir la palabra antes de poder realizar la siguiente acción (publicar un post o crear un registro p.e.)- resultaba una tarea imposible para los spambots de aquel momento. Pocos años después cientos de millones de Captcha eran tipografiados por cientos de millones de personas a diario. Es difícil imaginar qué persona habrá hecho perder más tiempo de forma estéril que a la Humanidad von Ahn con mayor reconocimiento.

mdf_captcha_2Figura 2.

Años después o von Ahn no se sentía lo suficientemente realizado, comprendido, famoso, millonario o la tentación del lado oscuro era demasiado poderosa pero algo le tuvo que suceder, para llegar a comprender que en una economía neoliberal global no tenía sentido ese derroche mano de obra y tiempo de otros sin generar beneficio. Así fue como von Ahn decidió que debía hacer algo aún por la prosperidad del género humano, además de hacerle perder ingentes cantidades de tiempo escribiendo palabras ridículas.

Así que, von Ahn creó ReCaptcha y para hacer más difícil que los spambots pudieran identificar una palabra habría que poner dos acertijos visuales (figura 3 y 4). La epifanía de von Ahn fue darse cuenta de que se podía poner la inmensa capacidad computacional humana al servicio de la economía colaborativa (que como todo buen enmarcado lingüístico significa lo contrario de lo que nombra). O lo que es lo mismo, que se podía obtener un beneficio gigantesco del derroche de tiempo y trabajo de cientos de millones de personas tipografiando palabras y números absurdos a que obligaba su Captcha.

El ReCaptcha presentaría una segunda palabra o imagen proveniente de grandes programas de escaneo de obras escritas, imágenes, etc. necesitados de desambiguación. Así, donde las máquinas no consiguen identificar por métodos de OCR lo escaneado o fotografiado lo debían hacer los usuarios gracias a la economía colaborativa. Al escribir una palabra o imagen los usuarios de ReCaptcha están obligados a identificar lo que la tecnología disponible no ha podido solventar y con la segunda palabra o imagen confirmar, contra la BBDD, que no son spambots. En síntesis, la idea de von Ahn con ReCaptcha fue que cuando la tecnología más avanzada disponible no pasa el test de Turing la Humanidad debía trabajar el doble que con Captcha. El único inconveniente es que no se debía preguntar a nadie si desea utilizar Captcha u otro sistema de identificación, sería obligatorio.

mdf_captcha_3Figura 3.

mdf_captcha_4Figura 4.

La idea de von Ahn era tan buena que en 2009 se la compró Google para desambiguar proyectos como Google Books, Google Street View, etc. en el que todos hemos colaborado de forma tan gratuita como obligada. Desde entonces Google lo ofrece gratis. Hace tres años se estimaba que más de 200 millones de reCAPTCHAs se completaban cada día y en los 2013 se calculó en 280 millones, siendo necesarios unos 10 segundos para completar uno. Viktor Mayer y Kenneth Cukier estiman en su libro Big Data que el ahorro generado por reCAPTCHA superaba los 2 millones de dólares diarios, esto es, 750 millones de dólares al año. En cinco años el ahorro puede haber superado los 4.000 millones de dólares gracias a la idea de von Ahn. Eso sí, se ha anunciado que se han desarrollado algoritmos para hackear ReCaptcha y también la forma de convertir Captcha, creo que ha tardado demasiado, en soporte publicitario. Y von Ahn, un héroe de las ciencias computacionales, ha creado un nuevo proyecto aparentemente neutro: Duolingo. Vale… en fin.

Post publicado originalmente en el blog de:

ATC para post

creative_commons

One Response

  1. Pingback: Frustromers | apple tree communications

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Loading Google+ Comments ...
Follow

Get every new post on this blog delivered to your Inbox.

Join other followers: