Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Industrial Internet of Things >> Incrustado

Cómo realizar la clasificación mediante una red neuronal:¿Qué es el perceptrón?

Este artículo explora la teoría básica y la estructura de una topología de red neuronal conocida.

Este es el primero de una serie de artículos que servirán como una extensa introducción al diseño, entrenamiento y evaluación de redes neuronales. El objetivo es realizar una clasificación compleja utilizando un programa informático Python que implementa una arquitectura de red neuronal conocida como Perceptron multicapa.

Puede encontrar el resto de la serie Perceptron aquí para su conveniencia:

  1. Cómo realizar la clasificación mediante una red neuronal:¿Qué es el perceptrón?
  2. Cómo utilizar un ejemplo de red neuronal de Perceptron simple para clasificar datos
  3. Cómo entrenar una red neuronal de perceptrón básica
  4. Comprensión del entrenamiento de redes neuronales simples
  5. Introducción a la teoría del entrenamiento para redes neuronales
  6. Comprensión de la tasa de aprendizaje en redes neuronales
  7. Aprendizaje automático avanzado con el perceptrón multicapa
  8. La función de activación sigmoidea:activación en redes neuronales de perceptrones multicapa
  9. Cómo entrenar una red neuronal de perceptrón multicapa
  10. Comprender las fórmulas de entrenamiento y la retropropagación para perceptrones multicapa
  11. Arquitectura de red neuronal para una implementación de Python
  12. Cómo crear una red neuronal de perceptrón multicapa en Python
  13. Procesamiento de señales mediante redes neuronales:validación en el diseño de redes neuronales
  14. Conjuntos de datos de entrenamiento para redes neuronales:cómo entrenar y validar una red neuronal Python

¿Qué es una red neuronal?

Las redes neuronales son herramientas de procesamiento de señales que se basan libremente en la estructura del cerebro humano. Suelen estar asociados con la inteligencia artificial (IA). No me gusta el término "inteligencia artificial" porque es impreciso y reductor. Si define "inteligencia" como la capacidad de realizar cálculos numéricos rápidamente, entonces las redes neutrales son definitivamente IA. Pero la inteligencia, en mi opinión, es mucho más que eso:es el tipo de cosas que diseña un sistema que rápidamente realiza cálculos numéricos y luego escribe un artículo sobre él, y luego reflexiona sobre el significado de la palabra "inteligencia", y luego se pregunta por qué los seres humanos crean redes neuronales y escriben artículos sobre ellas.

Además, la inteligencia artificial no es artificial. Es muy real inteligencia, porque es un sistema matemático que opera de acuerdo con la inteligencia de los seres humanos que lo diseñaron.

Las redes neuronales son rutinas de software que pueden "aprender" de los datos existentes y resolver de manera eficiente problemas complejos de procesamiento de señales. Es interesante estudiarlos y experimentarlos y, en algunos casos, superan con creces las capacidades de los algoritmos "normales". Sin embargo, no eliminarán el hambre en el mundo, no pueden escribir buena poesía y dudo que alguna vez conduzcan un automóvil con tanta seguridad como un ser humano que está sobrio y no escribe un mensaje de texto.

¿Qué es Perceptron?

Una red neuronal básica de Perceptron es conceptualmente simple. Puede consistir en nada más que dos nodos de entrada y un nodo de salida unidos por conexiones ponderadas:

La dimensionalidad de los datos de entrada debe coincidir con la dimensionalidad de la capa de entrada. El término "dimensionalidad" puede ser un poco confuso aquí porque la mayoría de la gente no puede visualizar algo con más de tres dimensiones. Todo esto realmente significa que sus datos de entrada, por ejemplo, un patrón que desea clasificar, es un vector con una longitud determinada y su capa de entrada debe tener un nodo para cada elemento en el vector. Entonces, si está tratando de clasificar un patrón representado por una serie de 20 puntos de datos, tiene un vector de 20 elementos y necesita 20 nodos de entrada.

Un nodo de salida genera datos de interés para el diseñador. El número de nodos de salida depende de la aplicación. Si desea tomar una decisión de clasificación sí / no, solo necesita un nodo de salida, incluso si hay cientos de nodos de entrada. Por otro lado, si el objetivo es colocar un vector de entrada en una de varias categorías posibles, tendrá varios nodos de salida.

Los datos que se mueven de un nodo a otro se multiplican por pesos. Estos valores escalares ordinarios son en realidad la clave para la funcionalidad del Perceptron:los pesos se modifican durante el proceso de entrenamiento y, al ajustar automáticamente sus pesos de acuerdo con los patrones contenidos en los datos de entrenamiento, la red adquiere la capacidad de producir resultados útiles.

¿Qué sucede dentro de un nodo? (También conocido como ¿Cómo funcionan las redes neuronales?)

Los nodos de la capa de entrada son solo puntos de conexión; no modifican los datos de entrada. La capa de salida, así como cualquier capa adicional entre la entrada y la salida, contiene los nodos computacionales de la red. Cuando los datos numéricos llegan a los nodos computacionales, primero se suman y luego se someten a una función de "activación":

El concepto de activación se remonta al comportamiento de las neuronas (biológicas), que se comunican a través de potenciales de acción que están activos o inactivos; se parece más a un sistema digital de encendido / apagado que a un sistema analógico. En el contexto de las redes neuronales (artificiales), los nodos, que también se denominan neuronas (artificiales), pueden imitar el comportamiento neuronal aplicando una función de umbral que genera 1 cuando la entrada es mayor que el umbral y 0 en caso contrario.

La siguiente gráfica transmite la relación entrada-salida de la función básica de activación del "paso unitario".

Al insertar esta transformación de umbral en la propagación de datos de un nodo a otro, estamos introduciendo la no linealidad en el sistema, y ​​sin esta no linealidad, la funcionalidad de una red neuronal es muy limitada. La teoría aquí es compleja, pero la idea general (creo) es que las combinaciones de transformaciones lineales, incluso si estas transformaciones lineales ocurren numerosas veces, nunca podrán aproximarse a las relaciones que caracterizan los fenómenos naturales complejos y las tareas sofisticadas de procesamiento de señales.

A pesar del hecho de que las neuronas reales operan de acuerdo con algún tipo de modelo de encendido / apagado, el enfoque de umbral para la activación de la red neuronal (artificial) no es óptimo. Volveremos a tratar este tema en un artículo futuro.

Conclusión

Hemos cubierto los elementos más básicos del Perceptron, y en el próximo artículo juntaremos estas piezas y veremos cómo funciona un sistema rudimentario.

Las redes neuronales son un tema extenso y les advierto que esta podría ser una serie larga. Pero creo que será bueno.


Incrustado

  1. ¿Qué es la computación en la nube y cómo funciona?
  2. ¿Qué es el microaprendizaje? Cómo cambiará el mundo en 2021
  3. ¿Qué está llevando a la IA al límite?
  4. Cómo aumentar la precisión de una red neuronal de capa oculta
  5. Cómo el ecosistema de red está cambiando el futuro de la granja
  6. ¿Qué es una red inteligente y cómo podría ayudar a su empresa?
  7. ¿Qué es una llave de seguridad de red? ¿Cómo encontrarlo?
  8. Cómo los fabricantes utilizan la automatización para gestionar el auge del comercio electrónico
  9. ¿Cuál es la función del cilindro de posicionamiento? ¿Cómo funciona?
  10. ¿Qué es un compactador y cómo elijo el adecuado?
  11. ¿Cuáles son los beneficios de usar tuberías de hierro dúctil?