Actualidad

Google crea un sistema de reconocimiento que describe el contenido de las fotos

6

Usando inteligencia artificial, es capaz de identificar lo que sucede en una imagen y describirla con precisión en complejos pies de foto

El sistema ordena los resultados por coincidencias perfectas, con errores mínimos, relacionadas y erróneas
18
NOV 2014

La digitalización de la fotografía y la irrupción de los teléfonos con sensores de alta resolución han conseguido que la mayoría de los usuarios abandone definitivamente la película para almacenar sus fotos en el interior de sus dispositivos o en la nube, creando enormes álbumes de inabarcables dimensiones cuya gestión a la larga termina convirtiéndose en un problema.

La tecnología desarrollada permite reconocer conceptos genéricos y abstractos para crear descripciones precisas de imágenes complejas

La georreferenciación de datos y la fecha de captura pueden ser una solución para ayudar a catalogar estas vastas colecciones fotográficas. Google quiere llegar más lejos con una nueva tecnología de reconocimiento que permite identificar el contenido de una foto y describirlo de forma adecuada con complejas etiquetas de texto.

El factor que diferencia a la tecnología de Google de otros sistemas de identificación es que no solo puede introducir etiquetas con palabras clave como "coche", "casa" o "flor", sino descripciones completas semejantes a "un coche aparcado frente a una casa" o "una flor de hibisco en un jardín". Las rutinas de inteligencia artificial utilizadas fueron creadas por un equipo de investigadores de la Universidad de Toronto, que las licenció a Google para su posterior desarrollo e implementación.

El sistema utilizado por Google utiliza redes neuronales que permiten a la inteligencia artificial identificar los objetos y situaciones en las fotografías estudiando una gran cantidad de imágenes convenientemente etiquetadas por seres humanos. Lo más importante es que el sistema no solo puede identificar conceptos visuales genéricos, sino también de cierta abstracción, lo que permitiría crear descripciones complejas como "dos personas bailando un tango".

Todavía queda trabajo por hacer

De acuerdo con Google, la tecnología todavía se encuentra en pleno desarrollo y todavía deberá ser depurada antes de poder ser ofrecida de forma abierta. Concretamente, la compañía señala el caso de un limaco accidentalmente confundido por el sistema con una serpiente y la fotografía de un burro identificado como un perro.

En el futuro, la identificación de imágenes creada por Google permitirá ordenar grandes colecciones fotográficas de forma automatizada. Google también cree que este tipo de tecnologías permitirán avanzar en la creación de sistemas de visión artificial que podrían ser de gran utilidad a la hora de mejorar la calidad de vida de personas invidentes.

Etiquetas
6
Comentarios
Cargando comentarios