La IA de Google genera código que supera a los programadores humanos

En mayo de 2017, Google Brain Team anunció un nuevo enfoque llamado AutoML. Es una red neuronal controladora para desarrollar una arquitectura de modelo infantil, que puede entrenarse para realizar una tarea particular. En términos simples, es una IA capaz de generar su propia IA.

El conjunto de datos utilizado

Los investigadores de Google probaron AutoML en pequeños conjuntos de datos académicos como Penn Treebank y CIFAR-10. Más tarde, decidieron presentarle a AutoML su desafío más difícil hasta la fecha. Esta vez, probaron conjuntos de datos más grandes, como la detección de objetos COCO y la clasificación de imágenes ImageNet, y el resultado que obtuvieron fue sorprendente.

Los humanos han desarrollado varias arquitecturas de aprendizaje automático de última generación para trabajar con conjuntos de datos más grandes en competencias académicas. En Aprendizaje de arquitecturas transferibles para el reconocimiento de imágenes escalable, los investigadores de Google aplicaron AutoML a dos de los conjuntos de datos académicos más populares:COCO e ImageNet. Si aplica AutoML de forma nativa a estos conjuntos de datos masivos, se necesitarían varios meses de capacitación para obtener resultados deseables.

¿Cómo funciona?

AutoML se basa en algoritmos de aprendizaje por refuerzo y algoritmos evolutivos. Sin embargo, para aplicarlo a ImageNet, los investigadores lo modificaron para que fuera más manejable en conjuntos de datos a gran escala –

Se rediseñó el espacio de búsqueda para que encuentre la mejor capa, que se puede apilar de manera flexible varias veces para construir una red final
La búsqueda de arquitectura se realiza en CIFAR-10 y la arquitectura mejor aprendida se transmite a la detección de objetos COCO y la arquitectura de imágenes ImageNet.

Después de estos cambios, AutoML pudo encontrar las mejores capas no solo para CIFAR-10, sino también para la detección de objetos COCO y la clasificación ImageNet. Estas 2 capas se fusionan para construir una arquitectura novedosa, llamada NASNet. .

Como se muestra en la figura, la arquitectura NASNet (desarrollada por AutoML) contiene 2 tipos de capas:capa normal y capa de reducción

Fuente:Blog de investigación de Google

Resultados

NASNet logró un 82,7 % de precisión de predicción en la clasificación de imágenes de ImageNet, lo que es mucho mejor que los modelos iniciales anteriores creados por el equipo de Google Brain. Además, obtuvo un rendimiento un 1,2 % mejor que los resultados anteriores publicados y no publicados.

También se puede cambiar el tamaño de NASNet para generar un conjunto de modelos que logren tasas de precisión decentes y al mismo tiempo mantengan bajos costos computacionales. Por ejemplo, una versión pequeña de NASNet produce una precisión del 74 % (al tiempo que reduce el costo computacional a la mitad), lo que es más de un 3 % mejor que varios modelos de última generación del mismo tamaño, diseñados para plataformas móviles.

Como puede ver en las figuras, las precisiones de NASNet son mayores que las de los modelos inventados por humanos en numerosos tamaños de modelo, lo que implica un número diferente (en millones) de operaciones y parámetros para la clasificación de imágenes de ImageNet.

Esta tabla muestra el rendimiento de la búsqueda de arquitectura y otros modelos desarrollados por humanos en la clasificación de ImageNet. Multi-Adds se refiere al número de operaciones compuestas de acumulación múltiple para una imagen.

Detección de objetos usando Faster-RCNN con NASNet

Los investigadores de Google transfirieron las funciones aprendidas de ImageNet a la detección de objetos COCO. En las pruebas, la integración de las funciones aprendidas de ImageNet con el marco Faster RCNN eclipsó el rendimiento predictivo anterior en COCO. El modelo más grande logró un mAP del 43,1 %, lo que representa alrededor de un 4 % mejor que los resultados anteriores de modelos de última generación.

Referencia: arxiv.org

El código fuente de NASNet para inferencia sobre clasificación de imágenes y detección de objetos está disponible en Github.

¿Qué sigue?

Las funciones aprendidas por NASNet en COCO e ImageNet se pueden reutilizar para varias aplicaciones de visión. Además, este enfoque puede enseñarnos algo sobre por qué tipos específicos de redes neuronales funcionan tan bien.

AutoML podría abrir el campo del aprendizaje automático a los no expertos y podría utilizarse para desarrollar máquinas/robots sofisticados impulsados por IA. Según una investigación, la IA en este nivel de inteligencia puede ayudar a las personas con discapacidad visual a recuperar la vista.

Obviamente, esta arquitectura se puede utilizar en vehículos autónomos. También puede imaginarse el sistema ayudando a identificar el tráfico, los peligros en la carretera y los peatones. También podría usarse en Realidad Aumentada para hacer que las aplicaciones interactúen mejor con el entorno. Pero quizás las aplicaciones más intrigantes de esta IA aún estén por descubrir.

Leer:15 proyectos avanzados de inteligencia artificial

En el futuro, el equipo de investigación de Google trabajará en el análisis y prueba de este tipo de arquitecturas generadas por computadora para refinarlas y comprenderlas mejor. Si tienen éxito, podrán inspirar un tipo completamente nuevo de redes neuronales, que tendrían un mayor impacto en todos.

Japón lanza un prototipo de computadora cuántica 100 veces más rápido que las supercomputadoras actuales Baterías de estado sólido de iones de magnesio:más seguras y eficientes que las de litio

Tecnología Industrial

Proceso de manufactura

Impresión 3d

Sistema de control de automatización

Tecnología Industrial