307

Posted On May 13, 2012 By In BLOG, COMUNICACION, MARKETING, REPUTACION ONLINE And 710 Views

No envíes a una máquina a hacer el trabajo de un humano (inteligente)

Una máquina que pudiese entender el lenguaje natural ha sido -y es- uno de los sueños de la Inteligencia Artificial desde los mismos orígenes de las ciencias computacionales. Un deseo que resurgió en los años 80 y renace en los últimos años a partir de la necesidad de interpretar cientos, miles o centenares de miles de opiniones que conforman heterogéneos climas de opinión alrededor de temas, marcas, productos, personalidades, etc.  por medio de tecnologías de rastreo online. Este tipo de herramientas de monitorización o webmining pretenden, en su extensa mayoría, crear la ilusión de poder realizar un análisis automático de las opiniones con un desarrollo semántico que tardará aún décadas en ser desarrollada hasta niveles meramente aceptables de capturas e interpretación automática de sentidos y significados.

Hoy por hoy, vivimos en una web sintáctica, buscamos como buscamos (hotel barato centro Roma) porque no hay buscadores semánticos eficientes a escala razonable. Adaptamos nuestras búsquedas a la tecnología disponible y para hacerla útil y supuestamente inteligente nos hacemos estúpidos en nuestra manera de buscar información. Si existiese una web semántica habría motores semánticos eficaces y es muy posible que lo tuviese Google, no por filantropía con el género humano (hace mucho que aquello de Don´t be evil pasó a la historia de las frases afortunadas) sino para que Adwords fuese mucho más rentable. O simplemente Google no existiría.

Lo cierto es que Google podría ser la gran esperanza semántica y lo único que hace Google es cambiar y cambiar su algoritmos (dando quebradores de cabeza a los SEO -a los buenos programadores y sobre todo a los malos) y ofreciendo una búsqueda supuestamente social cada vez más irrelevante o más vinculada con sus propios resultados en lugar de búsquedas semánticas. Lo que debemos esperar de un motor de búsqueda sintáctico es exhaustividad y relevancia aunque no parece que sea ese el camino que ha adoptado Google en los últimos años, que para esquivar sus fracasos y limitaciones sociales, en los que Google+ parece ser el siguiente fracaso, acaba manipulando y alterando los resultados esperados, como sucede con Maps y, sobre todo con G+ (aunque parece que también está rectificando en esto último, ¿quién lo sabe?).

El lenguaje y cómo lo utilizamos no son las matemáticas ni la física, ni siquiera el de la ciencia se puede unificar, esto se sabe ya desde los primeros intentos de los pensadores del Círculo de Viena y Ludwig Wittgenstein, con su Tratactus, en las primeras décadas del siglo XX de matematizar el lenguaje. Lo interesante es como el sueño semántico se reaviva cada cierto tiempo pensando que una máquina creada por los hombres puede ser semántica y ser capaz de solventar lo que el lenguaje, como herramienta de comunicación, ha madurando durante miles de años.

No estamos ante un problema de exceso de información sino de filtros, propósito de análisis y explotación inteligente de esa información. Por tanto, la limitación real en Internet no reside en el acceso a la información sino a su sentido y significados. Como afirma el tecnólogo Jaron Lanierla esperanza de que el lenguaje sea como un programa informático ha muerto. En cambio, la música ha cambiado [se refiere al MIDI y sus consecuencias] para transformarse en algo similar a un programa informático” (Lanier, 2011:215). Mientras llega, o no, la máquina que pueda pensar –aunque ésta sea intangible, ubicua y una creación humana- tenemos que seguir analizando, pensando y tomando decisiones nosotros

 

creative_commons

Tags : , , , , , ,

9 Responses

  1. El lenguaje es el cauce de nuestra libertad. La web semántica o penetra en el modo de ser libre o no alcanzará su sueño. Me pregunto ¿Esto es posible? ¿No es acaso la libertad el antídoto que trae “de serie” el ser humano para no caber en un algoritmo?
    Un abrazo y felicidades por este post!!

  2. Quizás es lenguaje sea la última frontera que quede por colonizar por automatización, daría para una estupenda charla… Gracias

  3. Interesante este post, aunque has abierto unos cuantos frentes sobre los que se podría debatir durante varios meses. Todas las crisis sociales han venido acompañadas de una necesidad de dotar de contenido y valor a todo lo que nos rodea, incluido el lenguaje, buscamos el significado en un intento de encontrar que es “verdad” y no sólo desde una perspectiva moral. Esto es un problema. Nunca nos pondremos de acuerdo sobre la definición de “Libertad” “Democracia” o “Mentira” y lo que es peor ni siquiera sabremos si palabras como “verde” son realmente lo mismo para todo el mundo. Pero ahí estamos, manejándolas a diario, luego, como decía el Wittgenstein más maduro, quizás debamos centrarnos en el lenguaje como algo funcional. Y aquí es donde entra Google, que captó perfectamente la idea, ha utilizado el lenguaje como herramienta no sólo de comunicación sino como un producto comercial más. Francamente, L. Wittgenstein lo fliparía. ;-)

    Hace unas semanas, en un intento desesperado por poner mi futura empresa en el mercado, envié una carta a Google pidiéndole comprar palabras (Tags), en vez de pagar por publicidad me pareció más interesante abonarle por una determinada palabra circunscrita a un territorio, de manera que cada vez que alguien de ese territorio pusiese en el buscador esa palabra apareciese mi empresa y cualquier blog o comentario asociado a ella. Desgraciadamente me dijeron que eso no podía hacerse. Me direis que eso es manipulación, pero ¡¡No!! quería dotar de contenido semántico a una palabra y ¡¡vive Dios!! que no iba a escatimar en medios. ;-)

    No hay una ley que impida comercializar el vocabulario. Los diccionarios llevan años vendiéndose, ¿Cual será el siguiente paso?

    Un Saludo.

  4. ¡Hola! Muy buen artículo. He tenido experiencias con buscadores o programas de monitoreo para redes sociales y debo admitir que en todos los casos, he descubierto que son un fracaso. Algunas plataformas, “intentaban” asignarle “tono” a las conversaciones (dividiéndolas en positivos y negativos). Claro estaba que la plataforma no podía distinguir por ejemplo la ironía de los usuarios a la hora de expresarse. Resulta difícil creer que ese tipo de tecnología podrá llegar a desarrollarse. No obstante, ante esta necesidad, surgen los Community Managers para hacerse cargo del “buzz” o “ruido” en las redes sociales. A pesar de que no se puede oír todo, la metodología utilizada es similar a la de una encuesta en donde siempre se toma una muestra representativa del total de la población. ¡Saludos! @facuadamoli

  5. Pingback: No envíes a una máquina a hacer el trabajo de un humano (inteligente) | Miguel Del Fresno | Marketing Comunidad

  6. Por su interés traigo un comentario a la publicación en MarketingComunidad de este post publicado por Antonio.Matarranz que escribe:

    “Hombre, sustituir a un humano inteligente, no. Pero, qué ocurre cuando son necesarios 100 humanos inteligentes? El análisis de medios sociales no sólo es difícil por el lenguaje natural, sino por las “3 Vs” de su Variedad, Volumen y Velocidad. Si un equipo humano puede analizar cientos de mensajes al 85% de precisión y un ordenador puede procesar millones al 75% y en tiempo real las máquinas sin duda pueden ayudar.”
    ____________
    Mi respuesta es:
    Antonio, estoy casi de acuerdo contigo, intento explicarme.

    1) cuando se hace una investigación a escala nacional no hay que preguntar a todos los españoles, p.e. sobre la intención de voto. Hay técnicas estadísticas y metodología científica.

    2) Las 3Vs, las desconocía, pero el lugar de estudio no es el objeto de estudio. La variabilidad la puedes sumar a esas tres V,s que no han nacido con Internet ni con los medios sociales.

    3) Un equipo humano puede analizar el 100% de los mesnajes si has hecho bien los puntos anteriores y captar los significados y sentidos. ah! y no hacen falta 100.

    4) No sé de dónde tomas esos datos pero no hay ninguna tecnología ni procesador de lenguaje natural que llegue al 75%, vamos ni de lejos.

    5) No niego la utilidad de una máquina según para qué cosas, pero que todas las que conozco de análisis del sentiment automático fracasan en mayor o menor medida es indudable. Y sí no, ¿por qué no hay buscadores semánticos más que a pequeña escala? Los indices de neutralidad que obtienen la mayoría de las herramientas y los fallos de asignación de sentido y significado son muy altos.

    y 6) no por ser crítico con los límites del PLN planteo postura alguna contra la tecnología si sólo mostrar sus limitaciones y esquivar a los vendedores de humo más o menos mal o bien intencionados.

    Gracias por tu comentario,
    Miguel

  7. Facundo,
    veo que ya has hecho la curva de aprendizaje con la tecnología “semántica” :) Cada uno debe desarrollar la metodología necesaria en función de su interés, objetivos y propósito. Gracias por tu comentario. Abrazo
    M

  8. Sigue La conversación con Antonio Matarranz

    Hola Miguel,
    Estoy de acurdo con lo de la estadística si quieres hacer algo parcial pero representativo. No obstante, mi impresión es que la respuesta ante crisis y, sobre todo, el famoso “engagement” con tu audiencia, exigen un tratamiento más exhaustivo e inmediato.
    En cuanto a la precisión del 75%, esa es la que estamos obteniendo con buenas herramientas entrenadas para el dominio de que se trate.
    En Daeadalus pronto vamos a liberar un producto en esa línea. Actualmente se encuentra en beta privada.
    Y vamos a liberar un corpus de tweets anotados para que, quien quiera, pueda evaluar y comparar sus soluciones. Más info:
    http://www.daedalus.es/TASS/about.php
    Gracias
    .

    Mi respuesta:

    Es muy posible que estemos en gran medida de acuerdo ☺ si me lo permites creo que mezclas tres conceptos diferentes en uno. Por un lado el conocimiento del clima de opinión con suficiente volumen, lo que denomino investigación. Segundo, el seguimiento de la creación del clima de opinión en tiempo real, que podemos acordar en denominar monitorización. Y tercero, lo que llamas “engagment” con la audiencia que suelo denominar gestión de la comunicación y que no creo que haya “herramientas” ni tecnología para hacerlo (más allá del spam).

    Por último será estupendo conocer lo que cuentas de “la precisión del 75%, esa es la que estamos obteniendo con buenas herramientas entrenadas para el dominio de que se trate” Seguro que es cosa mía, pero no lo acabo de entender o es una herramienta semántica o no lo es. En todo caso os deseo el mayor éxito posible.

    Gracias por tu comentario,
    más en http://www.migueldelfresno.com

  9. Pingback: Paradojas de internet: que (sí) es la reputación online | Miguel Del Fresno | Marketing Comunidad

Leave a Reply

Your email address will not be published. Required fields are marked *

Loading Google+ Comments ...
Follow

Get every new post on this blog delivered to your Inbox.

Join other followers: