La IA puede resolver el cubo de Rubik en segundos, sin ningún conocimiento de dominio específico
- El nuevo enfoque de aprendizaje por refuerzo profundo llamado DeepCubeA puede resolver el cubo de Rubik en unos pocos segundos.
- El modelo de aprendizaje profundo se puede aplicar a varios otros campos, incluidos la robótica y las ciencias naturales.
La inteligencia artificial (IA) ya ha demostrado su eficacia en el ajedrez y el Go, pero los acertijos más difíciles como el cubo de Rubik no se han resuelto mediante la inteligencia artificial. Es un rompecabezas combinacional clásico que plantea desafíos únicos e intrigantes para el aprendizaje automático.
Aunque anteriormente se han utilizado técnicas de aprendizaje automático para resolver el cubo de Rubik, no han logrado resolver el rompecabezas de manera eficiente y confiable. Además, estas técnicas han tenido que depender de conocimientos de dominio específicos.Ahora, investigadores de la Universidad de California, Irvine, han creado un enfoque de aprendizaje por refuerzo profundo llamado DeepCubeA que puede resolver un rompecabezas increíblemente complejo sin ningún conocimiento de dominio específico. Puede resolver un cubo de Rubik en unos pocos segundos sin la ayuda de humanos en el juego.
A medida que aumentan las dimensiones, la complejidad del rompecabezas combinatorio subyacente aumenta dramáticamente. Encontrar una solución óptima para el rompecabezas de 15, por ejemplo, toma una fracción de segundo en una computadora convencional, mientras que encontrar una solución óptima para el rompecabezas de 24 podría llevar días en la misma máquina.
En este estudio, los investigadores intentaron desarrollar un modelo de aprendizaje automático que puede aprender a resolver una variedad de acertijos sin depender del conocimiento humano específico del dominio. Combinaron tres enfoques de vanguardia para desarrollar DeepCubeA -
- Aprendizaje profundo
- Refuerzo clásico (iteración de valor aproximado)
- Métodos de búsqueda de rutas (ponderación A * búsqueda)
Consiste en un algoritmo de aprendizaje por refuerzo profundo que utiliza una función de política y valor combinada con la búsqueda del árbol de Monte Carlo para resolver el cubo de Rubik.
Los investigadores utilizaron el marco de aprendizaje profundo de TensorFlow para entrenar la red:se entrenó en aproximadamente 10 mil millones de simulaciones del rompecabezas codificado y completado. Todo el proceso se llevó a cabo durante aproximadamente 1,000,000 de iteraciones que tomaron 36 horas.
Referencia:Naturaleza | DOI:10.1038 / s42256-019-0070-z | UCI | Demostración en línea
Una vez entrenado, DeepCubeA pudo lograr el 100% de precisión durante cada configuración de prueba, encontrando el camino más corto al estado final el 60,3% del tiempo.
DeepCubeA utiliza una función heurística que nunca sobreestima el costo de una ruta más corta. La búsqueda ponderada A * tiene ciertos límites sobre cuánto puede variar la longitud de la solución de la longitud de una solución óptima.
Aplicaciones más allá de los rompecabezas combinatorios
El equipo de investigación también entrenó a DeepCubeA en otros acertijos, incluidos 24, Lights Out y Sokoban. Pudo encontrar el camino más corto en la mayoría de los casos verificables.
El objetivo final de estudios [como este] es desarrollar modelos de aprendizaje profundo de próxima generación que se puedan aplicar en campos más allá de los rompecabezas combinacionales, que van desde la robótica hasta las ciencias naturales.
Ya interactuamos con la IA a diario a través de motores de búsqueda y aplicaciones como Alexa y Siri. Sin embargo, estos sistemas no son realmente inteligentes:se pueden manipular o engañar fácilmente.
Leer:La nueva IA para jugar al póquer puede destruir muchas empresas en línea, por lo que los desarrolladores no la están lanzando
Necesitamos construir una IA que sea más robusta, más inteligente y capaz de comprender, razonar y planificar. El estudio es un pequeño paso hacia este enorme objetivo.
Tecnología Industrial
- 5 cosas de las que podemos prescindir en la fabricación para 2025
- ¿Pueden las casas modulares resolver la escasez de viviendas en Estados Unidos?
- Los láseres pueden enviar mensajes de audio al oído de una persona sin ningún receptor
- La IA ahora puede calcular la estructura 3D de cualquier proteína
- El nuevo método puede convertir cualquier objeto en una unidad de almacenamiento de datos
- La IA puede resolver un problema de tres cuerpos 100 millones de veces más rápido
- La IA ahora puede navegar por entornos desconocidos sin un mapa
- Cómo un TMS puede habilitar la visibilidad dentro de las cadenas de suministro globales
- Tres dolores de cabeza que cuestan trabajo y que la tecnología puede resolver
- ¿Puede un "monorraíl" para contenedores solucionar la congestión del puerto?
- Cinco formas en que la IA puede resolver la interrupción de la cadena de suministro