Internacional

El programa que enseña a las computadoras a "pensar" en imágenes

Las computadoras necesitan conocer las imágenes para poder identificarlas. Un programa en EE.UU. pretende que sean capaces de asociar imágenes sin haberlas aprendido antes, una especie de "sentido común" de las máquinas.

Redacción

BBC Mundo

¿Pueden las computadoras reconocer imágenes como lo haría un humano?

Es el principal objetivo de un programa de la Universidad Carnegie Mellon en Estados Unidos, que está tratando que las computadoras adquieran la capacidad de asociación humana mediante el análisis de imágenes durante 24 horas al día.

El mundo visual es aún un enigma para las máquinas.

Hasta ahora, los motores de búsqueda basaban el rastreo de imágenes en la indexación de palabras que tuvieran asociadas.

En los últimos años, la investigación se ha centrado en conseguir que las computadoras reconozcan las formas, tamaños, colores, etc., mediante algoritmos y muestren resultados visuales asociados a la búsqueda.

El programa llamado "El eterno aprendiz de imágenes" o "Never Ending Image Learner" (NEIL) en inglés ya ha analizado tres millones de imágenes, desde julio.

Como resultado, la visión artificial de la computadora logró hacer 2.500 asociaciones, después de identificar 1.500 objetos entre medio millón de imágenes y 1.200 escenas en miles de imágenes.

Las computadoras ya consiguen identificar y etiquetar los objetos utilizando la visión artificial de la máquina, pero los investigadores esperan que NEIL aprenda las relaciones entre los diferentes elementos sin que hayan sido previamente enseñados.

Como ejemplos de los vínculos que NEIL ha conseguido hacer, comprenden el hecho de que los coches se encuentran en las carreteras y que los patos pueden parecerse a los gansos.

El proyecto está siendo financiado por el Departamento de la Oficina del Departamento de Defensa e Investigación Naval de Estados Unidos y Google.

Sentido común

"Las imágenes son la mejor manera de aprender las propiedades visuales", cuenta Abhinav Gupta, profesor asistente de investigación en el Instituto de Robótica de la Carnegie Mellon.

"Estas, además, incluyen una gran cantidad de información de 'sentido común' acerca del mundo. Las personas aprenden esto por sí solas y, con NEIL, esperamos que las computadoras puedan hacer lo mismo", explica Gupta.

El sentido común, en este caso, hace referencia a la capacidad de reconocer lo que no se ha enseñado de forma explícita.

Por ejemplo, explica la experta en tecnología de la BBC Hannah Fraser, "las personas aprendermos ciertas normas sociales pero a veces, nos encontramos en una situación para la que no se nos ha enseñado una respuesta".

"Es ahí cuando utilizamos lo que hemos aprendido y lo aplicamos a una nueva situación. Ocurre lo mismo con las computadoras, en el terreno de la asociación".

Pasos de gigante

"En los últimos cinco o 10 años de investigación de visión artificial, hemos aprendido que cuantos más datos tenga una computadora, mejores resultados logra", añadió Gupta.

Otro de los objetivos del programa NEIL es crear la base de datos de conocimiento visual más grande del mundo, donde los objetos, escenas, acciones, atributos y relaciones contextuales puedan ser etiquetados y catalogados.

El aumento en el volumen de datos ha sido el principal desarrollo de la visión artificial en los últimos años.

"Anteriormente, las bases de datos consistían en apenas unos cientos de imágenes", explica Hannah Fraser, experta en tecnología de la BBC. "Hoy en día, el volumen de datos es enorme. Miles de millones. ¡Una locura!", revela.

Para Fraser, además, el interés de los gobiernos por mejorar la seguridad es clave en la financiación y el desarrollo de esta tecnología.

Uno de los grandes cambios que experimentó este campo de la computación fueron los atentados del 11 de septiembre en Nueva York.

El suceso "desencadenó un flujo de financiación hacia el área de la seguridad, en la investigación académica. Un ejemplo son las cámaras que tratan de reconocer caras mediante la visión artificial de las computadoras. Por ejemplo, identificar sospechosos, desde caras hasta la forma en que se camina en la distancia", explica.

Sin embargo, para Lewis Griffin, profesor de Ciencias de la computación en la británica University College London, la visión artificial de los ordenadores está dando pasos de gigante gracias al creciente interés de las compañías tecnológicas.

El siguiente artículo se está cargando

Escucha la radioen directo

Caracol Radio
Directo

Tu contenido empezará después de la publicidad

Programación

Ciudades

Elige una ciudad

Compartir

Más acciones

Suscríbete

Tu contenido empezará después de la publicidad