Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Industrial Internet of Things >> Incrustado

Las tecnologías mejoradas acelerarán la aceptación de los asistentes de voz

La invención del teléfono hace más de 150 años provocó una revolución en las comunicaciones. Hoy en día, la revolución de las comunicaciones por voz se encuentra en medio de un nuevo salto cuántico, ya que nuevas clases de dispositivos inteligentes hacen posible que la inteligencia artificial (IA) extraiga significado del sonido y brinde a las personas nuevas formas de interactuar con su mundo de una manera más intuitiva. camino. Este artículo examina dónde nos encontramos hoy y presenta una vista previa de las tecnologías que harán de los asistentes de voz ubicuos una parte natural de nuestra vida.

“Sr. Watson, ven aquí… ”

Las famosas palabras pronunciadas por Alexander Graham Bell en 1876 marcaron la primera vez que el sonido se transmitió eléctricamente. Esta innovación que cambia el mundo permanece en el centro de cambios dramáticos en la forma en que trabajamos, vivimos y jugamos, y es una parte integral de los nuevos avances en la forma en que interactuamos con el mundo que nos rodea.

En su primer siglo, la red telefónica cableada conectaba a personas de todo el mundo. Luego, la revolución electrónica de los últimos 50 años hizo que las conversaciones de voz y video fueran inalámbricas y portátiles. En esta década, hemos pasado de conversaciones telefónicas con manos libres entre personas a conversaciones con máquinas. Si bien aún es rudimentario, este nuevo tipo de interacción hombre-máquina está impulsando el siguiente salto en innovación.

Las computadoras, los teléfonos inteligentes y los parlantes inteligentes ahora cuentan con asistentes de voz integrados que utilizan sistemas de aprendizaje profundo basados ​​en la nube para permitirnos hacer preguntas y programar acciones. La misma capacidad pronto se integrará en otros dispositivos que usamos todos los días. Se estima que para 2020, hasta 1.800 millones de personas tendrán acceso a un asistente de voz en los dispositivos que llevan consigo y en otros tipos de plataformas en sus hogares e incluso en entornos comerciales, según Statistica.

Sin embargo, el éxito de los sistemas de asistente de voz todavía se ve desafiado por las limitaciones de las tecnologías actuales. Los avances en inteligencia artificial, procesadores especializados y micrófonos más sensibles mejorarán el rendimiento de los asistentes de voz y acelerarán la adopción del mercado.

Hacer que las conversaciones sean humanas

Un desafío al que se enfrentan los sistemas de asistente de voz es que las conversaciones humanas son increíblemente ricas e interactivas. A veces, un amigo puede responder a tus declaraciones antes de que termines una oración. En términos técnicos, los tiempos de respuesta cuando las personas hablan entre sí se miden en decenas de milisegundos. Si bien una respuesta lenta y reflexiva ocasional es muy natural cuando habla con amigos, imagine lo incómodas que serían sus interacciones diarias si la brecha normal de la conversación incluyera demoras de hasta varios segundos o necesidades frecuentes para repetir una pregunta o comando.

La lentitud de la “conversación” del asistente de voz está relacionada con varios aspectos de la tecnología subyacente. Los algoritmos que impulsan el reconocimiento y la respuesta de voz requieren mucha potencia de procesamiento, por lo que los teléfonos inteligentes y los sistemas de altavoces inteligentes actuales graban y luego transmiten el habla a los recursos informáticos en la nube. Para minimizar la posibilidad de retrasos en la transmisión, los sistemas normalmente transmiten archivos de audio de baja calidad, lo que conduce a altas tasas de error. E Internet en sí es un medio de velocidad variable, por lo que la velocidad de transmisión puede cambiar. La combinación de estos dos factores siempre afectará la calidad de los asistentes de voz que dependen de la nube para hacer el trabajo pesado del reconocimiento de voz.

Incluso con estos inconvenientes, los consumidores claramente están entusiasmados con la tecnología. Las ventas de sistemas de altavoces inteligentes, el primer producto completamente nuevo después de los teléfonos inteligentes que ofrece asistentes de voz, están creciendo a un ritmo no visto desde que se introdujeron los primeros teléfonos inteligentes. Las ventas de dispositivos en los EE. UU. Aumentaron un 40% en 2018 y las ventas de 66,4 millones de unidades nuevas aumentaron la cantidad de altavoces inteligentes a 133 millones, lo que representa un poco más del 26% de los adultos de EE. UU., Según voicebot.ai.

También es inevitable que los asistentes de voz sigan mejorando para emular conversaciones. El retraso de la conversación se reducirá y la mejora de los algoritmos hará que la interacción se parezca más a una interacción humana. Una gran parte de estas mejoras provendrá de acercar el procesamiento al usuario.

Llevando la conversación al límite

La tecnología que hace que los asistentes de voz basados ​​en la nube sean una realidad ahora avanza a un ritmo que hará que estos dispositivos sean mucho más personales. Los asistentes de voz actuales transmiten información hacia y desde la nube. Mañana, la IA que hace que esto sea posible residirá en el dispositivo de borde, proporcionando beneficios en la privacidad, el consumo de energía y la capacidad de respuesta del sistema. En resumen, la informática de punta promete hacer que los asistentes de voz sean más efectivos al mover la IA desde la nube a nuestro hogar, a nuestro lugar de trabajo y a otros dispositivos integrados en el mundo que nos rodea. En un paso hacia este futuro, Infineon demostró recientemente la solución de reconocimiento de palabras clave más poderosa del mundo.

Un área muy prometedora para los asistentes de voz más inteligentes es el control de la salud personal y médica. Por ejemplo, un micrófono de alta sensibilidad puede monitorear los sonidos respiratorios mientras duerme y predecir la aparición de trastornos del sueño como la apnea del sueño. Muchas personas pueden sentirse incómodas con este tipo de información de salud personal transmitida a la nube para su procesamiento. El procesamiento de borde permitirá monitorear y analizar esta información localizando la captura de audio, el cálculo y el almacenamiento de los datos analizados. Los usuarios podrán administrar cómo y cuándo se comparten los datos. Un asistente de voz que asegura niveles más altos de privacidad hará que las personas se sientan más cómodas con el monitoreo de la salud cardíaca y respiratoria, los estados de sueño y el bienestar general.

Los avances en inteligencia artificial que vemos hoy están impulsados ​​por la investigación de aprendizaje profundo y los nuevos tipos de hardware que se utilizan para construir sistemas especializados de aprendizaje profundo. El socio de Infineon, Syntiant, pionero en esta área, está construyendo una nueva clase de chips que brindan aprendizaje profundo a los dispositivos periféricos. Dentro de unos pocos años, la interacción hombre-máquina con la ayuda de la tecnología de asistente de voz será algo cotidiano para miles de millones de personas. Y la tecnología desarrollada para asistentes de voz más inteligentes tendrá características de uso de energía que permitirán un pequeño reconocimiento de audio inteligente alimentado por baterías para muchas otras aplicaciones. Para pronosticar dónde más tiene valor la tecnología, considere cómo los sonidos que escucha afectan la forma en que interactúa con el mundo. Fuera de la vista de los usuarios cotidianos, la tecnología de asistente de voz se convertirá en parte del conjunto de sensores en las máquinas inteligentes que operan en Internet de las cosas (IoT) y como parte de la Industria 4.0.

Los vehículos autónomos también utilizarán la entrada de audio en combinación con otros sensores para detectar y responder al entorno circundante. Sonidos como bicicletas, trenes, otro tráfico y niños gritando son entradas a la red de inteligencia artificial que permitirá a los automóviles "ver" objetos en las esquinas. En una fábrica, los sonidos de las máquinas en funcionamiento se pueden utilizar en redes de control inteligentes que diagnostican problemas potenciales antes de que sucedan. Los sistemas de ciudades inteligentes “escucharán” eventos inusuales como la rotura de vidrios o un accidente de vehículo y alertarán a las autoridades correspondientes. Y las generaciones futuras de robots emplearán sistemas de audio como parte de la red de sensores que respaldan el funcionamiento y la interacción inteligentes. De hecho, la lista de aplicaciones potenciales es interminable.

- Pradyumna Mishra es emprendedora residente de Infineon Technologies


Incrustado

  1. Cómo 5G acelerará el IoT industrial
  2. Los sensores de imagen para automóviles ofrecen un rango dinámico mejorado
  3. Las tecnologías clave se fusionan en sistemas robóticos avanzados
  4. Los procesadores especializados aceleran las cargas de trabajo de AI de punto final
  5. ¿Crecerá el IoT alguna vez?
  6. ¿COVID-19 acelerará la robótica en la cadena de suministro?
  7. 12 tecnologías emergentes en electrónica que cambiarán nuestro futuro
  8. Investigación de Forrester:La pandemia mundial alterará y acelerará los planes de automatización
  9. Nearshoring acelerará un aumento en los trabajos de fabricación
  10. Tecnologías que dominarán la fabricación en 2021
  11. Los expertos opinan:¿Cómo impactará la naturaleza en un futuro robótico?