Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Industrial Internet of Things >> Incrustado

Núcleos de brazo diseñados para dispositivos TinyML

Arm ha presentado dos nuevos núcleos IP diseñados para impulsar el aprendizaje automático en dispositivos de punto final, dispositivos IoT y otras aplicaciones de bajo consumo y sensibles a los costos. El núcleo del microcontrolador Cortex-M55 es el primero en utilizar la tecnología de procesamiento de vectores Helium de Arm, mientras que el acelerador de aprendizaje automático Ethos-U55 es una microversión de la familia Ethos NPU (unidad de procesamiento neuronal) existente de la empresa. Los dos núcleos están diseñados para usarse juntos, aunque también pueden usarse por separado.

La habilitación de aplicaciones de inteligencia artificial y aprendizaje automático en microcontroladores y otros dispositivos sensibles a los costos y con recursos limitados de baja potencia se conoce como el sector tinyML. Con el aumento de 5G iniciando una tendencia hacia una mayor inteligencia en los dispositivos de punto final, se espera que tinyML crezca exponencialmente hasta convertirse en un mercado que abarca miles de millones de sistemas industriales y de consumo.

“Cuando miramos hacia atrás dentro de cinco años, todos podemos estar de acuerdo en que esta vez marcó un verdadero cambio de paradigma en la informática”, dijo Thomas Ensergueix, director senior de IoT e Embedded, Arm. “Hemos visto en unos pocos años cómo la IA ha revolucionado la forma en que se ejecuta el análisis de datos en la nube, la mayoría de nosotros tenemos un teléfono inteligente mejorado con IA en nuestros bolsillos, y ahora este es el siguiente paso:prepararse para la IA en todas partes”.


Los dispositivos domésticos inteligentes, como los altavoces inteligentes, serán cada vez más capaces de realizar inferencias de aprendizaje automático por sí mismos (Imagen:Sebastian Scholz / Unsplash)

El aprendizaje automático, incluidas las aplicaciones de reconocimiento de voz y visión por computadora, tendrá lugar cada vez más en el microcontrolador. Está surgiendo una gama de alternativas de microcontroladores, basadas en los núcleos de Arm y otros, a los que Arm apunta con estos dos nuevos núcleos.

“Sabemos que todos estos datos a nivel de endpoint no pueden volver a la nube”, dijo Ensergueix. “Las cámaras de video en el hogar o en una ciudad inteligente crean literalmente gigabytes de datos al día y la infraestructura no está diseñada para este flujo de datos ascendente. Estamos convencidos de que lo que necesitamos para escalar hacia miles de millones o billones de puntos finales de IoT, necesitaremos la capacidad de inferencia de IA directamente en el punto final de IoT. Y debe ser seguro ".

Cortex-M55

La última incorporación a la conocida serie Cortex-M de Arm para microcontroladores, el Cortex M-55 está diseñado para ser el núcleo Cortex-M con mayor capacidad de inteligencia artificial de Arm.

El M55 es el primero en utilizar la nueva tecnología de procesamiento de vector de helio de Arm, que promete un rendimiento DSP 5 veces más rápido y un rendimiento ML 15 veces más rápido, en comparación con las generaciones anteriores de Cortex-M. Basado en la arquitectura Armv8.1-M, ​​se pueden crear instrucciones personalizadas para optimizar el procesador para cargas de trabajo específicas, tal vez para exprimir hasta la última gota de energía.

La combinación del M55 y el U55 aprovecha la potencia DSP aumentada del M55, que se puede utilizar para el preprocesamiento de señales. Sin embargo, el M55 puede ejecutar cargas de trabajo de redes neuronales por sí mismo. Cuenta con instrucciones dedicadas para números INT8, incluido el producto punto, que se usa comúnmente en aplicaciones de aprendizaje automático.

Una aplicación AIoT exitosa “depende no solo de un buen rendimiento de cómputo, sino también de poder obtener los datos correctos, los coeficientes correctos y los pesos de aprendizaje automático correctos en el momento correcto, por lo que la interfaz de memoria del procesador se ha optimizado para poder manejar todos los datos que entran y salen. Es mucho más capaz que cualquier otro núcleo Cortex-M en este aspecto ", dijo Ensergueix.


La combinación de Cortex-M55 y Ethos-U55 tiene suficiente poder de procesamiento para aplicaciones como reconocimiento de gestos, biometría y reconocimiento de voz (Imagen:Arm)

Ethos-U55

El Ethos-U55 se está facturando como el primer "micro-NPU" de Arm, que ofrece hasta 0.5 TOPS de aceleración (basado en geometrías más pequeñas como 16 o 7 nm, corriendo a 1 GHz). Arm aún no ha publicado cifras de eficiencia energética (TOPS / W). Es configurable (se pueden usar de 32 a 256 unidades de acumulación múltiple (MAC)) y tiene un decodificador de peso y acceso directo a la memoria para descompresión de peso sobre la marcha.

El Ethos-U55 se une al Ethos N77, N57 y N37 que, en comparación, ofrecen 4, 2 y 1 TOPS, respectivamente. El rendimiento se puede ampliar mediante el uso de varios núcleos Ethos.


Cortex-M55 y Ethos-U55 están diseñados para usarse juntos, pero también pueden usarse por separado (Imagen:Arm)

Los dos nuevos núcleos, M55 y U55, están diseñados para usarse juntos, donde pueden procesar tareas de ML 480 veces más rápido que cualquier dispositivo Cortex-M de la generación anterior solo. Arm dice que las cifras típicas para una aplicación de asistente de voz de un extremo a otro que usa ML son 50 veces más rápidas en comparación con el uso de un Cortex-M7 solo, y un aumento de 25 veces en la eficiencia energética.

“El Cortex-M ejecutaría el código del sistema de la aplicación y luego, cuando se requiere procesar una carga de trabajo de red neuronal, el flujo de comando para eso se coloca en SRAM, se da una interrupción al U55 y dice, aquí, vaya a trabajar en esto flujo de comandos ”, explicó Steve Roddy, vicepresidente del grupo de aprendizaje automático de Arm. “Eso podría ser una única inferencia de un solo modelo. El U55 se ejecuta hasta el final, vuelve a poner los resultados en SRAM y luego deja que Cortex-M se haga cargo. O podría ser el tipo de situación en la que se ejecuta continuamente mientras realiza algún tipo de procesamiento de transmisión de datos, tal vez audio o video ".

El silicio basado en estos nuevos núcleos debería llegar al mercado a principios de 2021.


Incrustado

  1. Una memoria más inteligente para dispositivos IoT
  2. Arm habilita instrucciones personalizadas para núcleos Cortex-M
  3. Innodisk:Soluciones AIoT para el campo médico
  4. t para buscar en una máquina CNC
  5. 7 consejos para elegir un taller mecánico
  6. ¿Qué es una fresadora y para qué sirve?
  7. Serie diseñada para la línea de producción automotriz
  8. Torno diseñado para precisión y velocidad
  9. Máquina de torneado alimentada por bobina diseñada para piezas pequeñas
  10. Sistema de torneado de husillo secundario diseñado para diámetros grandes
  11. Centro de torneado diseñado para piezas pequeñas