Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Manufacturing Technology >> Sistema de control de automatización

El poder de la IA en la automatización industrial

Los enfoques más avanzados para sistemas robóticos totalmente inteligentes

La IA (inteligencia artificial) permite la automatización de un número creciente de procesos comerciales y aplicaciones industriales. El alcance y el ritmo de la automatización inteligente dependen directamente de los avances en IA y, como tal, han experimentado grandes avances en los últimos años. En combinación con una poderosa visión artificial en 3D, la IA permite que los robots reconozcan, localicen y manejen cualquier tipo de objeto y, por lo tanto, automaticen tareas que serían demasiado peligrosas, monótonas o exigentes para los humanos.

Pero, ¿qué se entiende por IA en la automatización industrial, cómo funciona y qué posibilidades abre a las fábricas y empresas que luchan por la modernidad, la innovación y el aumento de la productividad? En primer lugar, echemos un vistazo a los comienzos de la IA y su desarrollo gradual.

De las primeras arquitecturas a las redes neuronales convolucionales

El término IA puede representar una serie de capacidades y procesos de la máquina, desde estadísticas simples a través de árboles de decisión hasta redes neuronales, como las redes neuronales convolucionales, o incluso enfoques más avanzados, como el aprendizaje por refuerzo.

La historia del desarrollo de la IA fue testigo de varios enfoques, pero las redes neuronales demostraron ser las más prometedoras e interesantes gracias a su capacidad de generalización.

En la década de 1990 y principios de la de 2000, las redes neuronales recibieron gran atención gracias a las primeras aplicaciones exitosas de reconocimiento de caracteres que incluían la lectura de números escritos a mano. en cheques bancarios y códigos postales de letras. Estas redes neuronales fueron entrenadas en un llamado conjunto de datos MNIST (que significa Instituto Nacional de Estándares y Tecnología Modificado ), que es una colección de dígitos escritos a mano del 0 al 9 utilizados en aprendizaje automático y visión artificial para entrenar sistemas de procesamiento de imágenes. El conjunto de datos MNIST sirvió como base para los algoritmos de clasificación de evaluación comparativa y todavía se usa hoy en día con fines de capacitación y prueba.

Aunque estas redes neuronales clásicas pueden aprender prácticamente cualquier cosa, representan una arquitectura antigua y totalmente conectada. y capacitarlos requiere mucho tiempo y esfuerzo . Esto se debe a que todas las neuronas de una capa están completamente conectadas con las neuronas de la siguiente capa, lo que significa una gran cantidad de parámetros para aprender, aumentando con el tamaño de una imagen. Aunque el rendimiento de las computadoras mejoró con el tiempo, aún toma mucho tiempo entrenar el reconocimiento incluso de imágenes pequeñas.

Un punto de inflexión en el desarrollo de la IA estuvo marcado por la introducción de redes neuronales convolucionales (CNN) . Las CNN se utilizan principalmente para analizar imágenes visuales, incluida la clasificación de imágenes o el reconocimiento de patrones , y forman la columna vertebral de muchos sistemas modernos de visión artificial. Otro campo principal de aplicación es el procesamiento del lenguaje natural.

Una CNN está, en términos generales, inspirada en el sistema de la corteza visual del cerebro. La idea principal detrás de las CNN no es conectar todas las neuronas entre sí, como es el caso de las redes totalmente conectadas, sino solo con las neuronas vecinas para crear proximidad, ya que las entradas vecinas, como los píxeles, transportan información relacionada. Esto significa que las CNN pueden tener varias capas y las neuronas de una capa solo están conectadas a las neuronas de la siguiente capa que están espacialmente cerca de ellas . Esto reduce la complejidad, la cantidad de neuronas en la red y, en consecuencia, también la cantidad de parámetros para aprender. Gracias a esto, las CNN son más rápidas de entrenar, necesitan menos muestras y también se pueden aplicar a imágenes más grandes.

El término “convolucional” se refiere al proceso de filtrado a través del cual las CNN detectan patrones. Las capas individuales convolucionan , es decir, combinar , la entrada y pasar el resultado a la siguiente capa.

El progreso en el desarrollo de las CNN también se ha visto acelerado por los avances en las unidades de procesamiento de gráficos (GPU). Su rendimiento y poder de cálculo han mejorado enormemente en los últimos años, abriendo nuevas posibilidades para entrenar CNN.

Uno de los líderes más reconocidos en el campo de la IA, a menudo denominado el "padrino de la IA", es Geoffrey Hinton. . Es licenciado en psicología experimental e inteligencia artificial. Esta combinación le dio una gran perspectiva sobre cómo entrenar redes neuronales artificiales.

En 2012 su alumno Alex Krizhevsky marcó otro punto de inflexión en la IA cuando creó una CNN que podía imitar la forma en que el cerebro humano reconoce los objetos. La CNN fue nombrada AlexNet y por primera vez en la historia permitió que una máquina identificara objetos como una persona.

Este avance popularizó las redes neuronales convolucionales y mostró la gran variedad de aplicaciones en las que se podían usar las CNN.

Entrenamiento de una red neuronal convolucional

En el reconocimiento de objetos, es importante que una CNN tenga una propiedad llamada invariancia . Esto significa que es invariable a la traducción, el punto de vista, el tamaño o la iluminación para poder interpretar patrones de entrada y clasificar objetos independientemente de dónde y cómo se coloquen en una imagen. Para lograr esto, la CNN necesita ser entrenada en una cierta cantidad de ejemplos. Una de las mejores prácticas para aumentar la cantidad de datos relevantes en un conjunto de datos es el aumento de datos. .

El aumento es la práctica de modificar los datos de entrada, es decir, la imagen original, para generar otras versiones ligeramente modificadas de la misma. Las técnicas de aumento incluyen volteo horizontal o vertical, rotación, escalado, recorte, movimiento de la imagen en la dirección X o Y, y otros.

Entrenar una CNN con datos alterados hace que sus neuronas sean inmunes a tales aumentos y evita que aprenda patrones irrelevantes. Por lo tanto, un loro volteado seguirá siendo reconocido como un loro.

Lo que resulta muy útil aquí es el llamado aprendizaje de transferencia . Para eliminar la cantidad de datos de entrenamiento, se puede usar una red existente y ya entrenada y aplicar algunos de sus filtros para el reconocimiento de nuevos tipos de objetos. Por ejemplo, una red entrenada para el reconocimiento de perros también se puede utilizar para el reconocimiento de gatos manteniendo algunos de sus filtros y modificando solo una parte determinada. Esto significa que la red se adaptará al reconocimiento de gatos.

Beneficios de las redes neuronales convolucionales modulares

El gran valor de las CNN radica en su arquitectura y en el hecho de que los módulos individuales miran bloques de una sola imagen. No es necesario entrenar los módulos simultáneamente y se pueden unir fácilmente. La combinación de estos módulos bien entrenados dio lugar a arquitecturas complejas que se pueden usar para la segmentación .

A diferencia de AlexNet, que solo puede reconocer lo que hay en la imagen, estas CNN complejas pueden segmentar objetos y definir la ubicación del objeto en la imagen. .

Esta modularidad permite usar varios canales de entrada, lo que significa que si la CNN se usó para datos en blanco y negro, también se puede usar para datos en color, y si se usó para datos en color, se puede ampliar con información de profundidad. Agregar información adicional mejora el rendimiento de la CNN , which includes increased accuracy and better recognition of objects and their positions.

From object recognition to smart automation solutions

Based on the above features and characteristics of convolutional neural networks, Photoneo took CNNs as a basis for its advanced robotic intelligence systems and automation solutions .

Photoneo’s CNN works with black &white data, color data, as well as depth information. The algorithms are trained on a large dataset of objects and if they come across new types of items, they can quickly generalize, that is, recognize and classify objects which it has not “seen” before.

Let’s take the concept of a box, for instance. The algorithms were trained on a large dataset of boxes so they understand that a box has a certain amount of faces, edges, and vertices. This principle will also work for boxes that the algorithms have not come across before, even squeezed or damaged ones. The greatest value of AI lies in the fact that it can generalize concepts that it was trained on without further retraining.

This enables Photoneo systems to recognize items of various shapes, sizes, colors, or materials – a robotic ability used for the localization and handling of mixed objects, including organic items such as fruit or fish, sorting of parcels, unloading of pallets laden with boxes, and many other industrial applications.

It might also happen that the algorithms come across objects with features that are fundamentally different from those the algorithms were trained on. This might confuse the CNN and cause a decrease in its performance. What can be done to solve this problem is either to prevent it by expecting exotic objects or to have a good retraining system. In the latter case, the performance will be temporarily lower but the CNN will be retrained to reach full performance rather quickly.

In case a customer needs to pick unusual items or non-commercial products such as industrial components, the CNN can be trained on a specific dataset containing these exotic items .

When it comes to the realization of a customer project, the customer receives Photoneo’s CNN for pilot testing and a feasibility study to ensure that the network can be used for that particular application. This CNN can then be improved and further trained on images from the pilot phase of the project, which will provide greater variability.

The greatest challenge in AI-powered object recognition and picking

The greatest challenge could also be described as the last puzzle piece that was missing in the range of pickable objects. This last piece was bags .

The difficulty lies in the nature of bags since they are extremely deformable and full of wrinkles, folds, and other irregularities. Despite the challenges that bags pose to AI, Photoneo developed a system that is able to recognize and pick bags, may they be full, half-empty, colored, transparent, or semi-transparent. This task is often challenging even for the human eye, which may find it difficult to recognize boundaries between bags that are chaotically placed in a container, especially if they are transparent.

However, good recognition and localization of bags are only part of the precondition for successful object picking. The other part relates to the mechanical side of an application – the robot gripper. The fact that bags are full of folds and wrinkles increases the risk that they will fall off the gripper. This risk can be prevented by using an appropriate vacuum gripper with feedback.

Future developments of AI

Despite significant advancements that have been made in AI in recent years, the field still offers a vast space for new achievements. For instance, so-called reinforcement learning receives great attention as it seems to be very promising in suggesting complex movements, for instance allowing a robot to adjust the position of an item before grasping it.

Reinforcement learning is not only able to cope with object recognition but also with mechanical problems of an application. This means that it not only enables a system to recognize items but also assess the individual steps of a robot action on the basis of rewards and punishments and “calculate” the chance of success or failure . In other words, AI algorithms are trained to make a sequence of decisions that will lead to actions maximizing the total reward. An example of the power of reinforcement learning is mastering and winning the board game of Go.

Despite its immense potential, reinforcement learning is closely linked to the environment it is set in and to the limitations it may pose. For example, the deployed gripper and its functionalities and limitations will always influence a system’s overall performance.

AI is the main driver of emerging technologies and its developments will be very dependent on a number of factors, including market demands, customer expectations, competition, and many others.


Sistema de control de automatización

  1. Liberando el poder del Internet industrial de las cosas
  2. Los efectos positivos de la automatización agrícola
  3. 4 formas de implementar la automatización industrial
  4. Tendencias en Automatización Industrial
  5. Cómo elegir un controlador de automatización industrial
  6. Automatización industrial
  7. Por qué y cómo la automatización industrial es el futuro
  8. La energía inalámbrica RF libera la ubicuidad de las redes de sensores
  9. STAEDTLER:el valor de la automatización en la fabricación
  10. Comprender el valor de la automatización en la fabricación
  11. Cómo se utiliza la automatización industrial en la Estación Espacial Internacional