lunes, 25 de enero de 2016

El lenguaje y la computación cognitiva

Vamos hacia un mundo en el que la inteligencia estará presente en cada proceso, en cada dispositivo




La computación cognitiva es el conjunto de tecnologías que se inspiran en la inteligencia de los sistemas biológicos. Comprende también a las tecnologías que proporcionan una interacción más natural con los seres humanos. El lenguaje humano es la comunicación nativa entre humanos. Las empresas que incorporen sistemas cognitivos basados en lenguaje humano tendrán una gran ventaja competitiva sobre el resto.

La escritura comenzó en Mesopotamia como contabilidad hace cinco mil años. Las primeras tabletas de arcilla contenían cuentas sobre adquisición y mantenimiento de productos como rebaños o cosechas. Solo después de un tiempo, la escritura pasó a ser una herramienta al servicio del lenguaje. La historia parece repetirse siglos después con los ordenadores. Durante cinco décadas han estado usándose para cálculo numérico y especialmente para contabilidad. Pero las cosas están cambiando y desde hace un lustro los ordenadores han comenzado a adentrarse en el mundo del lenguaje humano.

El lenguaje es la ventana de la mente y pese a ser la parte más accesible de nuestra vida intelectual seguimos sin comprenderlo muy bien. A este desconocimiento se unen problemas que hacen de él un reto formidable para los ordenadores: es ambiguo, impreciso, contextual, erróneo y plagado de dobles significados e ironías. A pesar de ello, nuestros esfuerzos por manejarlo con máquinas están empezando a dar resultados.

El reconocimiento del habla (speech to text) puede parecer sencillo si lo observamos de pasada. Al fin y al cabo, los niños lo aprenden antes de los dos años. Pero eso es precisamente un problema: aprender por completo la fonética de un idioma de adulto es casi imposible como puede comprobar cualquiera que haya estudiado una segunda lengua. De hecho nos pasamos parte de nuestras conversaciones preguntando ¿qué? ¿puedes repetirlo? Pese a su gigantesca dificultad, el reconocimiento de habla por los ordenadores ha progresado hasta el punto que ya es útil y pronto igualará el rendimiento de los seres humanos. Las ventajas de dictar a un ordenador sobre escribir en un teclado son evidentes y la incorporación total de esta tecnología a los sistemas cognitivos es solo cuestión de tiempo. Lo contrario, la lectura de un texto (text to speech) está razonablemente resuelto hace tiempo.

La traducción presenta problemas aún más complejos de índole sintáctico y semántico. Los traductores no funcionan muy bien hoy, pero lo hace mejor que en el pasado y en poco tiempo tendrán un nivel que permita su uso totalmente productivo. Muchas empresas tienen su sistema de traducción como Google, Microsoft, IBM o Facebook.

Uniendo las tres partes, fonética, sintaxis y semántica, Skype (propiedad de Microsoft) ha anunciado un sistema que permite a un usuario hablar en un idioma y que al otro lado sea escuchado en un idioma distinto. El mensaje oral es pasado a texto en el idioma origen, traducido al idioma destino y leído. De momento solo funciona entre inglés y español. Google ha anunciado la misma funcionalidad.

El hito más sorprendente del uso del lenguaje por los ordenadores fue la victoria de IBM Watson sobre sus oponentes humanos en el concurso de TV Jeopardy donde demostró un elevado dominio de las sutilezas del lenguaje. Watson incorpora más de un centenar de componentes lingüísticos algunos de los cuales son dependientes del idioma y otros son neutrales. Es esta dependencia lo que hace a Watson “intraducible”. Muchos módulos deben de ser reescritos para cada lengua. Pese a las dificultades, IBM anunció que Watson iba a estar disponible en portugués y español (en este caso gracias al acuerdo firmado con CaixaBank). Ahora acaba de anunciar que estará disponible en japonés mediante un acuerdo con el gigante de las comunicaciones Softbank.

Pero el avance no está en que los sistemas de las grandes corporaciones usen el lenguaje humano. El verdadero avance es que cualquier empresa o el desarrollador de cualquier modesta app puedan incorporar esta potencialidad. En la plataforma Bluemix hay más de una docena de servicios de Watson algunos de los cuales manejan el lenguaje y pueden embeberse en las aplicaciones de las empresas.

Las tecnologías que subyacen al manejo del lenguaje son potentes y sofisticadas. En un primer momento se usaron sistemas puramente estadísticos, por ejemplo el análisis comparativo de todos los documentos traducidos a varios idiomas de la ONU o la Unión Europea. Pero ahora se están incorporando las poderosas redes neurales, complejos algoritmos que responden a una vieja idea, la simulación de la inteligencia biológica, pero con una gigantesca capacidad de cálculo a su servicio.


¿Hablas a tu móvil? ¿El sitio de internet de tu empresa usa el lenguaje natural para comunicarse con los usuarios? Si la respuesta es positiva, enhorabuena, aún no sois muchos. Si es negativa, quizá deberías ir pensando en ello.

Este artículo ha sido publicado previamente en Computerworld

1 comentario:

  1. Es una gran noticia enterarnos de los avances que se han podido hacer al respecto. Y pensamos en las grandes ventajas y aplicaciones que esto podría tener para la psicología y la psicoterapia en el que para determinados problemas de interacción haya algoritmos que guién a las personas en tiempo real.

    ResponderEliminar