Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Industrial Internet of Things >> Tecnología de Internet de las cosas

Las comunicaciones se cierran en círculo:¿estamos volviendo a un mundo en el que la voz es prioritaria?

Craig Walker de Alcatel-Lucent Enterprise

Con la ola de asistentes personales, como Siri, Cortana y Google Asistente y nuevas empresas emergentes que aprovechan la inteligencia artificial (IA) y el análisis para crear compañeros personales, está quedando claro que estamos avanzando hacia una nueva relación con la tecnología controlada por voz.

Como ya hemos visto en el mercado de consumo, es casi un hecho que estos sistemas de activación por voz eventualmente llegarán al entorno empresarial, ya que los beneficios potenciales de estos sistemas podrían ser tremendos para simplificar y automatizar las actividades.

Aquí, Craig Walker, director de servicios en la nube de Alcatel-Lucent Enterprise , explica que, aunque puede pasar mucho tiempo antes de que veamos las imágenes completas de "HAL" de "2001:A Space Odyssey", la tecnología ya está aquí y puede mejorar la forma en que operan las empresas.

¡Luces, cámara, acción!

Piense en lo más fácil que sería para un médico decir simplemente "Sistema:actualice el cuadro de Mary Smith con lo siguiente:" Paciente que experimenta dolor abdominal, emite un pedido de farmacia de 200MG de 'SuperAntiGas', firmado por el Dr. FeelBetter ". O en una sala de conferencias, en lugar de la lucha por averiguar qué control remoto coloca en el proyector y la pantalla, una simple solicitud de voz "Sistema:encienda el proyector, encienda la televisión y atenúe las luces".

Los desafíos

Entonces, ¿dónde estamos en el camino hacia la voz primero? Empresa de análisis de voz, VoiceLabs , ha proporcionado una visión de las diversas capas necesarias para respaldar un enfoque de voz primero en el mundo del consumidor. Sin embargo, para pasar de los casos de uso simples basados ​​en el consumidor a proporcionar un entorno más centrado en la voz en el mundo empresarial, es necesario que sucedan algunas cosas.

La seguridad será fundamental si queremos que nuestros sistemas empresariales se basen en comandos de voz:¿alguien debería poder controlar equipos o sistemas críticos con solo hablar? La respuesta, claramente, es no. La privacidad también es una de las principales preocupaciones, y aunque el ejemplo del médico anterior parece bastante simple, debemos pensar en esto en el contexto de las regulaciones. ¿Se violan los derechos de un paciente, según las regulaciones de HIPAA en los EE. UU., Si estos comandos verbales exponen la información médica del paciente a terceros?

Acceso seguro

Ya estamos viendo el siguiente paso de los sistemas de reconocimiento de voz donde la tecnología es capaz de soportar un acceso seguro. Los bancos se encuentran entre los que están introduciendo la autenticación por voz en sus sistemas de banca telefónica. Si bien esto puede dejar a algunos clientes un poco preocupados por la seguridad de su cuenta, mi sensación es que seguirá el ciclo de adopción que vimos en el comercio electrónico, donde las preocupaciones iniciales por el fraude de tarjetas de crédito debían superarse antes de ver el ascenso meteórico. en compras online.

Continuaremos viendo la innovación continua en los sistemas de reconocimiento de voz y las mejoras que permitirán que la seguridad del sistema de voz sea viable en un entorno empresarial y garantizarán que solo los usuarios autorizados con los privilegios adecuados puedan realizar las acciones asociadas.

Y aunque es posible que su microondas no lo esté espiando, algunos dispositivos estarán siempre encendidos, siempre escuchando y potencialmente grabando. Unos pocos casos bien publicitados de invasión de la privacidad, espionaje comercial o riesgo legal podrían retrasar la adopción. Esto sugiere que se debe incluir un gran interruptor o función de encendido / apagado en los productos de voz primero, para que los usuarios puedan obtener los beneficios sin arriesgarse a las desventajas de un monitoreo constante. El acceso seguro al software también debería estar implementado en los productos para prevenir y detectar esfuerzos de piratería.

Creación de sistemas de reconocimiento de voz aún más eficaces

Los primeros casos de uso se refieren principalmente a los sistemas de respuesta de voz, ya sea desde la perspectiva de un centro de llamadas o desde los implementados en nuestros automóviles y teléfonos inteligentes. Pero como muchos de nosotros sabemos por experiencia propia, esto funciona marginalmente en el mejor de los casos. El reconocimiento y la contextualización deben refinarse a través de desarrollos tecnológicos antes de que podamos pensar de manera realista en la adopción en toda la empresa.

Los programas de investigación como el proyecto Sphinx de la Universidad Carnegie-Mellon continúan mejorando las capacidades de reconocimiento de idiomas. Un informe de Tendencias de Internet de Mary Meeker indicó que en 2016, el sistema de reconocimiento de voz de Google podía reconocer más de cinco millones de palabras con una precisión de alrededor del 90 por ciento, pero eso aún no es lo suficientemente extenso ni preciso. ¿La precisión del 90 por ciento es lo suficientemente buena para interactuar con un sistema de soporte vital en un hospital o la red de un proveedor de servicios públicos?

Tampoco se trata solo de reconocer las palabras, se trata de qué hacer con las palabras. Aquí es donde entran en juego los motores cognitivos y la inteligencia artificial. Algunos de los actores más importantes de la industria, por ejemplo, Microsoft , con su motor de reconocimiento cognitivo de código abierto, se puede aprovechar para comprender el contexto de las palabras. "¿Cómo llego a Green Park?" puede parecer bastante simple, pero debe ponerse en contexto.

El conocimiento de la ubicación podría indicar que probablemente te refieres a Green Park en Londres y suposiciones sobre el modo de transporte. Si estuviera sentado en Piccadilly Circus, la respuesta podría ser:"Tome una parada, en dirección oeste, en la línea Piccadilly", pero aquí asumimos que era Green Park en Londres y no Green Park en Manchester o Birmingham.

La búsqueda de un significado más profundo

El verdadero desafío radica en lo que hay detrás de los sistemas de reconocimiento de voz, tanto desde la integración de los dispositivos de IoT al sistema en sí, como para garantizar que los comandos solicitados tengan sentido. Aquí, necesitamos aprovechar aún más esos motores cognitivos como un sistema de verificación y validación.

Piense en alguien que accidentalmente diera un comando para "Apagar el sistema de enfriamiento del reactor 4" en lugar del reactor 3, que ya se ha apagado, o en un médico que usa el sistema para recetar una dosis dañina de medicamento porque accidentalmente dijo 400 gramos en lugar de 400 miligramos.

Estos pueden ser ejemplos extremos, pero será necesario tener una visión holística de las acciones que se están automatizando para prevenir errores humanos y aportar inteligencia más amplia para comprender las acciones relacionadas con las solicitudes controladas por voz. Por ejemplo, tal vez "Apague el sistema de enfriamiento del reactor 4" sea correcto, pero el sistema necesitaría comprender el conjunto de procedimientos operativos para implementar esas acciones.

Creación de una plataforma API para verdaderas soluciones integradas de voz

Un elemento interesante que podría relacionarse estratégicamente con el desarrollo de verdaderos entornos empresariales controlados por voz proviene de las innovaciones que ocurren en el mundo tradicional de la comunicación por voz. Estamos viendo la explosión de CPaaS (Plataforma de comunicación como servicio) en la empresa, aprovechando las API para transformar las aplicaciones actuales en soluciones integradas de voz.

Algunos de los principales proveedores de comunicaciones por voz están entrando ahora en este mercado, proporcionando infraestructuras CPaaS con un conjunto estandarizado de API para permitir que las empresas integren las comunicaciones en sus procesos comerciales.

Si bien tradicionalmente consideramos la integración como cosas como la incorporación de servicios de voz y video en aplicaciones existentes, piense en una aplicación bancaria que le permita pasar de una aplicación en línea a una llamada de voz con su asesor bancario, creo que esto jugará un papel importante en ese entorno de "voz primero" al aprovechar la rica infraestructura de API de CPaaS para comunicarse con aplicaciones y cosas.

Detrás de los requisitos de la infraestructura de comunicaciones, es necesario estandarizar la forma en que CPaaS u otras plataformas se comunican con los dispositivos antes de que veamos un rápido desarrollo de la tecnología de voz. Cada uno de los sistemas controlados por voz basados ​​en el consumidor de hoy en día tiene sus propias interfaces, sus propias integraciones de API y, al igual que con la batalla histórica "Beta contra VHS" de hace décadas, puede llevar a la obsolescencia del producto.

Así como un consumidor no quiere invertir en la última "cafetera inteligente" solo para descubrir que la plataforma que la controla acaba de descontinuarse, una empresa quiere asegurarse de que las inversiones que realice en nuevas tecnologías no queden obsoletas antes de que son capaces de realizar una devolución.

Lo mejor está por venir

La buena noticia es que se está trabajando en un conjunto de tecnologías para ayudar a minimizar la obsolescencia potencial. Se están desarrollando marcos como IoTivity para construir una plataforma estandarizada. Ya estamos viendo el valor, los beneficios y la rápida expansión de las nuevas aplicaciones de voz para los consumidores. A corto plazo, veremos que algunos de los casos de uso básicos se trasladan a la empresa.

A largo plazo, a medida que se sigan realizando avances en el reconocimiento de voz, la seguridad de la voz y la simplificación / estandarización en la conectividad de los dispositivos, veremos más y más actividades de voz en primer lugar tanto en el mundo de los consumidores como de las empresas para ayudar a reducir la complejidad y mejorar nuestra productividad.

El autor de este blog es Craig Walker, director de Servicios en la nube de Alcatel-Lucent Enterprise


Tecnología de Internet de las cosas

  1. Un vistazo al mundo de los tintes
  2. AI moviéndose lentamente hacia el piso de la fábrica
  3. Inicio fácil en el mundo de IoT con MQTT
  4. De nuestro CEO:El valor y la confianza son esenciales para avanzar
  5. ¿La seguridad y la privacidad están frenando a IoT?
  6. Por qué los principales fabricantes de equipos originales se están trasladando a la producción interna de chips
  7. Cómo están respondiendo los productores de alimentos a un mundo orientado a la entrega
  8. Por qué las empresas estadounidenses están trasladando sus cadenas de suministro de China a México
  9. Los contenedores están cayendo al mar. ¿Qué está pasando?
  10. Cinco lecciones de Covid:mirar hacia atrás para seguir avanzando
  11. ¿Qué son los metales no ferrosos? - Una guía completa