¿Qué es el aprendizaje profundo?
La película de 1990 de Arnold Schwarzenegger Total Recall describe una historia en 2084, casi un siglo en el futuro. El futuro tendrá coches autónomos, según la película. Esto era ciencia ficción en 1990 pero una realidad hoy. Apple, Alphabet, Nissan, Uber y muchas más empresas están trabajando en vehículos autónomos. Tesla vende coches autónomos funcionales a los consumidores finales, que parecen estar funcionando bien.
¿Qué hizo que la ciencia ficción se hiciera realidad en apenas tres décadas? La respuesta es el aprendizaje profundo.
De la inteligencia artificial al aprendizaje profundo
Hefesto, el dios griego del fuego y el trabajo del metal, creó máquinas y robots dorados. Ya en el Turco mecánico en la década de 1770, los humanos han estado desarrollando artilugios que imitan la inteligencia humana. Aunque los turcos mecánicos fueron un engaño, a finales del siglo XX se desarrollaron computadoras posteriores capaces de derrotar a los humanos. Todos ellos se realizaron en un esfuerzo por crear sistemas que puedan imitar el cerebro humano.
Figura 1. Una sección transversal del turco. Imagen utilizada por cortesía de Biblioteca de la Universidad Humboldt
La inteligencia artificial (IA) es el término que se le da a cualquier sistema informático que intente imitar el cerebro humano. La máquina de Turing de Alan Turing era un sistema de inteligencia artificial primitivo que usaba la lógica para llegar a soluciones.
El aprendizaje automático (ML) es un subconjunto de la IA que usa modelos para realizar tareas. Estos modelos se entrenan con una gran cantidad de datos. Deep Blue, la computadora que venció al campeón mundial de ajedrez Garry Kasparov en 1997, es un ejemplo de ML.
El aprendizaje profundo es nuevamente un subconjunto del aprendizaje automático en el que los modelos aprenden de los datos sin supervisión humana. Por lo tanto, los sistemas de aprendizaje profundo son capaces de aprender sin supervisión de datos no estructurados.
Aprendizaje profundo:¿cómo funciona?
El aprendizaje profundo se inspira en la estructura de los cerebros humanos que constituyen las neuronas que transmiten y procesan la información. Las estructuras utilizadas en el aprendizaje profundo se denominan redes neuronales artificiales (ANN). Las RNA pueden identificar y clasificar información sin supervisión humana y se dice que son capaces de aprender sin supervisión. Esto requiere un volumen de datos mucho mayor en comparación con el aprendizaje automático convencional, que utiliza el aprendizaje supervisado.
Las ANN constan de varias capas desde la capa de entrada hasta la capa de salida, a través de las cuales pasan los datos. Las capas restantes, además de las capas de entrada y salida, se denominan capas ocultas. La primera capa de ANN, o la capa de entrada, está formada por neuronas. Las neuronas de una RNA son funciones matemáticas que representan de cerca una neurona humana.
Figura 2. Concepto de capa de entrada y salida de ANN.
La transmisión de información a través de diferentes capas se realiza a través de canales de conexión. Cada nodo en las capas de ANN está conectado a cada nodo en la siguiente capa con estos canales. Cada canal tiene un valor asociado, conocido como su peso; por tanto, los canales se denominan canales ponderados.
Todas las neuronas en las capas ocultas tienen un número único asociado llamado sesgo. La información pasa de una capa al siguiente canal, tomando los pesos asociados con los canales. Cuando llega a la neurona en la siguiente capa, el sesgo se agrega a la suma ponderada de entradas.
El resultado de esta operación matemática se alimenta a la función de activación. La función de activación decide si la neurona debe estar activa o no. Esto se hace aplicando la función de activación no lineal al resultado obtenido agregando sesgo a las sumas ponderadas de los canales. Las funciones de activación añaden no linealidad a la salida de una neurona.
Solo las neuronas que están activas después de la aplicación de la función de activación pueden enviar información a la siguiente capa. Esto continúa hasta la capa final, la capa de salida. Los pesos de los canales de las neuronas y los sesgos en las capas ocultas se ajustan constantemente para recibir un modelo bien entrenado.
Algunos de los marcos de aprendizaje profundo más populares son:
- Tensorflow de Google
- PyTorch de Facebook
- Caffe de UC Berkeley
- Conjunto de herramientas cognitivas de Microsoft
- OpenAI
Datos para el aprendizaje profundo
Los datos son la materia prima para el aprendizaje profundo. En teoría, cualquier cantidad de datos mejora los modelos. Pero considerando el esfuerzo de recopilación de datos, el tiempo de entrenamiento requerido y la potencia computacional requerida para entrenar modelos, la cantidad de datos para el aprendizaje profundo no puede ser infinita. Por el contrario, muy pocos datos no producirán un modelo de aprendizaje profundo confiable.
No existe una regla simple para la cantidad de datos necesarios para entrenar un modelo exitoso. Depende principalmente del resultado de modelos entrenados. Si los modelos no son suficientemente confiables, se requieren más datos. Existen algunas reglas generales para los datos mínimos necesarios para entrenar modelos de aprendizaje profundo.
- Al menos 20 puntos de datos para predicciones con análisis de regresión
- Al menos 1,000 imágenes para clasificar con visión por computadora
Estas son dos heurísticas para estas aplicaciones más comunes con aprendizaje profundo. Los ingenieros de datos abogan por reglas similares para diferentes aplicaciones. Como ocurre con todas las reglas generales, estas no son perfectas y deberían cambiarse de acuerdo con la aplicación específica.
Aplicaciones industriales del aprendizaje profundo
Existen muchas aplicaciones industriales para el aprendizaje profundo. Repasemos algunos de ellos.
Vehículos autónomos
Los vehículos autónomos se venden ahora a los consumidores, pero también tienen muchas aplicaciones industriales. La conducción autónoma puede incorporarse a los dispositivos de transporte utilizados en las fábricas; por ejemplo, los vehículos autónomos guiados (AGV) pueden ser completamente autónomos. Esto elimina la necesidad de trabajo manual en tales tareas al tiempo que mejora la seguridad y la eficiencia.
Figura 3. Se utiliza un AGV en un almacén logístico.
Visión por computadora
Las computadoras clasifican y reconocen objetos a partir de imágenes. A veces, la visión artificial forma parte de los vehículos autónomos, pero tiene muchos más usos en aplicaciones industriales. La visión por computadora puede automatizar la clasificación de objetos. Los sistemas asistidos por visión por computadora pueden realizar inspecciones de calidad. También puede automatizar la vigilancia de las instalaciones de la planta y los procesos industriales.
Gestión de la cadena de suministro
La cadena de suministro de una empresa es un sistema complejo que abarca múltiples proveedores, geografías y regulaciones. Gestionar manualmente un gran volumen de tráfico de mercancías es una tarea imposible. El aprendizaje profundo se puede emplear para mantener una cadena de suministro saludable mediante el análisis de grandes volúmenes de datos generados con la ayuda de dispositivos IoT (Internet de las cosas) en la cadena de suministro.
Aplicaciones médicas
El aprendizaje profundo también tiene muchas aplicaciones médicas. Puede emplearse para identificar anomalías a partir de resultados de imágenes médicas como rayos X, resonancias magnéticas, etc. También puede monitorear la salud del paciente con dispositivos de monitoreo conectados durante todo el día. El aprendizaje profundo puede ayudar en el descubrimiento de fármacos al proporcionar la combinación más probable de moléculas.
El aprendizaje profundo tiene muchas más aplicaciones industriales en la industria aeroespacial, exploración espacial, minería, navegación, sistemas de defensa, ciberseguridad y la lista continúa. El aprendizaje profundo se está adoptando rápidamente en todas las verticales de la industria y pronto será un elemento crítico e inevitable de la Industria 4.0.
Tecnología de Internet de las cosas
- ¿Qué es un sensor de O2?
- ¿Qué es LTE-M?
- ¿Qué es ingrávido?
- 14 Preguntas frecuentes sobre LoRa respondidas
- ¿Qué es la gestión inteligente de residuos?
- ¡¿Qué hago con los datos ?!
- ¿Qué es A2 Steel?
- IA subcontratada y aprendizaje profundo en la industria de la salud:¿está en riesgo la privacidad de los datos?
- ¿Qué es la certificación del dispositivo?
- Inteligencia artificial frente a aprendizaje automático frente a aprendizaje profundo | La diferencia
- Deep Learning y sus múltiples aplicaciones