Un procesamiento de datos de voz más inteligente produce una mejor duración de la batería
Los dispositivos que siempre escuchan han hecho que sea infinitamente más fácil reproducir música, encender el televisor inteligente, bajar el termostato e incluso alertarnos cuando alguien ingresa a la casa. Pero nos piden que los conectemos a la alimentación de CA o que reemplacemos las baterías con demasiada frecuencia.
Si bien a veces parece que los asistentes de voz han estado en nuestras vidas durante décadas, solo a fines de 2014 Amazon lanzó el primer altavoz inteligente, Amazon Echo. Cinco años después, ahora tenemos cientos de millones de asistentes de voz digitales instalados en parlantes inteligentes, sistemas domésticos inteligentes, dispositivos portátiles y otros dispositivos inteligentes que siempre están escuchando una palabra de activación. Según su última investigación, SAR Insight &Consulting predice que para 2023, la base instalada de dispositivos habilitados para voz siempre activos aumentará a casi mil millones.
Los sensores que primero hicieron posible la escucha siempre y la voz primero, micrófonos de sistemas microelectromecánicos ultraminiatura (MEMS) del tamaño de la punta de un lápiz, capturan datos de sonido ambiental. Al principio, parecía una buena solución procesar esos datos en la nube, analizando el sonido en busca de palabras y comandos de activación. Pero el crecimiento exponencial de los asistentes de voz y otros dispositivos IoT siempre activos está produciendo tantos datos:41.600 millones de dispositivos IoT generando 79,4 zettabytes de datos en 2025, según International Data Corp. 1 - que estamos sobrecargando el ancho de banda colectivo y creando ineficiencias de costos y energía como una consecuencia no deseada. Esto está impulsando a la industria de los semiconductores a encontrar nuevas formas de llevar parte de esa poderosa computación en la nube al dispositivo, una capacidad llamada procesamiento de borde.
Desafíos al límite
El éxito de la informática de borde se basa en gran medida en la rápida proliferación de microcontroladores y procesadores de señales digitales de bajo consumo, algunos de los cuales incluyen una red neuronal incorporada, es decir, un pequeño chip de aprendizaje automático (TinyML). Estos chips de procesamiento, en su mayoría digitales, pueden manejar el análisis complejo de datos, como decidir si se ha dicho una palabra de activación, directamente en el dispositivo. Pero si bien estos chips ahora pueden ser tan inteligentes como un cerebro, todavía se basan en la arquitectura del sistema original que se usó en el primer dispositivo de detección siempre encendido, uno que requiere la conversión inmediata de todo el sonido, que es naturalmente analógico, a una señal digital. Eso es cierto incluso cuando el sonido, como el ladrido de un perro o el llanto de un bebé, no puede contener una palabra de activación. Derrochando energía y datos, este mismo enfoque siempre atento coloca a los OEM en un rumbo de colisión con la insatisfacción del consumidor.
Los consumidores aún esperan el mismo o mejor rendimiento de dispositivos inteligentes cada vez más pequeños que siempre escuchan y que pueden caber en un bolsillo o incluso dentro de un oído, pero sin sacrificar la duración de la batería. Eso coloca a los OEM en una situación difícil porque si se quedan con la arquitectura heredada, seguirán desperdiciando entre el 80% y el 90% de la duración de la batería procesando datos sin sentido. Se verán obligados a hacer que los consumidores elijan el menor de dos males:un asistente de voz no portátil que debe enchufarse a la pared o un asistente de voz portátil que puede ir a cualquier parte pero que se ve obstaculizado por la corta duración de la batería.
Debido a que mover datos a través de un sistema cuesta energía, la forma más eficiente de ahorrar energía es reducir la cantidad de datos a lo que es importante lo antes posible. Si realmente queremos resolver el desafío del poder de estar siempre atento, necesitamos un nuevo paradigma que imite más de cerca la capacidad del cerebro para procesar de manera eficiente la gran cantidad de datos provenientes del sistema sensorial humano en un momento dado. Gaste solo un poco de poder por adelantado para determinar qué es relevante y ahorre la mayoría de los recursos para procesar solo los datos más importantes.
El sonido es naturalmente analógico
Para mejorar la duración de la batería en dispositivos que siempre escuchan, es necesario adoptar una tecnología que muchos de los ingenieros actuales consideran anticuada e intimidante: analógica . Trabajar con señales analógicas no estructuradas y sin procesar de la palabra real, es decir, tacto, visión, audición y vibración, es difícil. Desde la introducción del primer circuito integrado digital, ha sido mucho más sencillo crear productos que procesen señales de sensores, con ceros o familiares, que procesar directamente los datos analógicos que se detectan. (Es por eso que los dispositivos siempre activos transforman la entrada analógica en señales digitales inmediatamente, antes de hacer casi cualquier otra cosa).
Si bien lo digital ha resuelto de manera efectiva los desafíos de procesamiento durante los últimos 50 años, finalmente podría haber chocado con un muro en las leyes de la física. La desaceleración en el escalado de dispositivos digitales ha hecho que los tecnólogos se vuelvan creativos con los chips dentro del dispositivo. En este caso, esa creatividad se ha producido a través de dos cambios fundamentales:utilizar digital de manera más estratégica, para que los chips digitales realicen un procesamiento pesado solo cuando sea necesario; y utilice la baja potencia inherente de los circuitos analógicos, combinada con el aprendizaje automático, para realizar una primera ronda de análisis que determine si la voz está presente mientras los datos de sonido aún se encuentran en su estado analógico natural. Eso mantiene los chips de procesamiento digital en modo de suspensión de bajo consumo hasta que realmente se necesitan para "escuchar" una palabra clave.
El camino hacia una mayor eficiencia energética en dispositivos siempre activos no radica en que cada chip "piense como un cerebro", sino en reinventar una arquitectura de sistema que se parezca más al sistema sensorial humano, analizando progresivamente el sonido en capas para que se concentre la mayor cantidad de energía. sobre lo más importante.
El procesamiento de bordes bioinspirado (abajo) concentra el poder de procesamiento digital en los datos sensoriales más pertinentes. (Imagen:Aspinity)
Todos ganan
La búsqueda de una mayor duración de la batería alentará a los diseñadores de sistemas a adoptar un nuevo paradigma arquitectónico en el que menos procesamiento de datos significa más duración de la batería. Residiendo en el borde, un chip ML analógico puede actuar como un administrador de tráfico inteligente que permite que los chips de procesamiento digital permanezcan inactivos a menos que sean necesarios. Este enfoque de procesamiento de borde siempre activo de inspiración biológica permite que los procesadores analógicos y digitales realicen los trabajos en los que son más eficientes, lo que convierte al consumidor en el ganador final. Después de todo, ¿quién no querría un control remoto de TV activado por voz que funcione durante un año con un solo juego de baterías?
Referencia
1 International Data Corp. Pronóstico mundial de datos y dispositivos de DataSphere IoT a nivel mundial, 2019-2023. Junio de 2019
>> Este artículo se publicó originalmente el nuestro sitio hermano, EE Times Europe.
Sensor
- Examen de IoT celular:costo, batería y datos
- Mantenimiento en el mundo digital
- Seguros digitales:5 tendencias digitales que dan forma a la industria de seguros
- Medidas para garantizar una experiencia digital segura
- Para el financiamiento de la cadena de suministro, el efectivo digital es simplemente mejor
- Empoderar a los equipos de fabricación digital con conocimiento
- Proceso + Datos Maestros &Transformación Digital, Parte II
- Gemelos digitales:¿Qué quieres decir con eso?
- Poner en marcha la transformación digital en la fabricación
- La transformación digital en Norbord mejora la productividad
- Cómo las tiendas pequeñas pueden volverse digitales, ¡económicamente!