Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Industrial Internet of Things >> Tecnología de Internet de las cosas

La solución biométrica de voz apunta a la autenticación

Los avances en inteligencia artificial ahora permiten una precisión suficiente en la biometría de voz que puede usarse no solo para la identificación y personalización, sino también para aplicaciones como la autenticación de pagos. Una nueva solución de Synaptics e ID R&D ofrece biometría de voz impulsada por IA y algoritmos anti-spoofing que pueden ejecutarse en un SoC Synaptics en el dispositivo de borde. Específicamente, el software se ha optimizado para la unidad de procesamiento neuronal (NPU) de la serie VS600 de Synaptics para dispositivos domésticos inteligentes como decodificadores (STB), altavoces inteligentes y sistemas de seguridad.

Synaptics vende sus SoC con capacidad de inteligencia artificial en productos para el hogar inteligente que necesitan procesar transmisión de video, transmisión de audio e imágenes. Un caso de uso típico podría ser un STB que incorpore cámaras para videoconferencias, por ejemplo.


La biometría de voz ahora es lo suficientemente precisa como para permitir la autenticación de pagos en dispositivos domésticos inteligentes

"Lo que es común en la aplicación de decodificadores y se está volviendo más común a medida que pasa el tiempo es la capacidad de usar la voz como interfaz", dijo Vineet Ganju, vicepresidente de marketing de Synaptics a EE Times . "Los controles remotos se pueden habilitar por voz para que pueda hablar con ellos para navegar por su cuenta de Netflix y buscar películas ... la voz como interfaz casi se está convirtiendo en estándar en estas aplicaciones".

Cuando un STB ejecuta Netflix, lo primero que deben hacer los usuarios es seleccionar qué perfil usar. Con la biometría de voz, el STB sabría inmediatamente quién estaba mirando, reduciendo un paso del proceso.

“Por ejemplo, con el contenido de pago por visión, no solo puede buscar por voz y encontrar ciertas películas que tal vez no sean parte de su suscripción, sino que está dispuesto a pagar $ 5 para verlas”, dijo Ganju. “Entonces [los operadores] quieren poder autenticarse de inmediato y pedirle que compre esa película en el acto. Ven eso como una gran reducción en la fricción, que ayuda a los usuarios no solo a encontrar contenido personalizado para ellos, sino también a poder pagar por ese contenido y poder verlo ".

Inscripción en el dispositivo

La IA de biometría de voz de ID R &D extrae más de 400 características de la voz, incluidas combinaciones de parámetros relacionados con la frecuencia / tono y otras cosas como la pronunciación y los acentos.

"No se limita a la forma en que lo eran algunas de las generaciones anteriores de biometría de voz", dijo John Amein, vicepresidente senior de ventas de ID R&D a EE Times , agregando que solo en el último año, la biometría de voz de AI ha logrado la precisión requerida para aplicaciones como la autenticación de pagos.

El algoritmo aprende a reconocer la voz del usuario a través de un proceso llamado "inscripción" durante el cual el usuario repite una frase tres veces. Se puede usar cualquier frase y funciona en cualquier idioma. La inscripción se procesa en el dispositivo de borde.

El algoritmo de inteligencia artificial de ID R &D puede identificar a los usuarios inscritos con una tasa de aceptación falsa por debajo de 1 en 10,000, que Amein compara con las probabilidades de que alguien adivine su PIN. La tasa de rechazo falso, la tasa a la que la voz del usuario inscrito es rechazada por error, es cercana al 5%. Y la tasa de aceptación de suplantación de identidad (SAR), para ataques de suplantación de identidad, como grabaciones de la voz del usuario reproducidas en el sistema, es mejor que el 7%, que es el límite estándar para el desbloqueo biométrico de dispositivos Android.

“Entre la coincidencia biométrica con una tasa de aceptación falsa de uno en 10,000 y la lucha contra la suplantación de identidad es mejor que la tasa del 7% requerida por el estándar de Android, realmente estamos alcanzando las dos cosas que son necesarias para que la biometría de voz sea aceptada lo suficientemente seguro para una autorización de pago ", dijo Amein.

Anti-spoofing

La tecnología anti-spoofing de ID R &D también se basa en la inteligencia artificial.

"La voz hablada tiene un ancho de banda que llega hasta los 3500 Hz, y estamos muestreando a una velocidad mucho más alta", dijo Amein. “Entonces estamos escuchando frecuencias más altas que la voz hablada. Escuchamos en estos rangos más altos para detectar diferentes características ".

La voz humana creada al hablar a través de nuestro tracto vocal tubular produce frecuencias características que son muy diferentes a los sonidos producidos por la vibración de una superficie plana como en un altavoz. Este es uno de los elementos que utiliza la IA anti-spoofing para distinguir una voz en vivo de una grabación.

“También podemos detectar voces sintetizadas, como aplicaciones de texto a voz”, dijo Amein. “Muchos de esos no son tan buenos, pero se están volviendo cada vez más realistas. Y en ese escenario, todavía hay anomalías en la señal; es demasiado perfecta en algunos casos, o solo habrá transiciones o diferencias de fase que el oído no puede oír, pero la [IA] sí ".

Unidad de procesamiento neuronal

Los SoC de la serie VS600 de Synaptics cuentan con una unidad de procesamiento neuronal (NPU); La NPU del VS680 ofrece 6.75 TOPS, mientras que el VS640 recientemente anunciado ofrece 1 TOPS y está dirigido a "más costos, rendimiento y puntos de potencia convencionales", dijo Vineet Ganju de Synaptics. La NPU de cualquiera de las partes tiene cómputo "más que suficiente" para ejecutar los algoritmos biométricos de voz de ID I + D y anti-spoofing simultáneamente, dijo. La NPU pudo acelerar la inferencia biométrica de voz en un factor de 10 en comparación con el uso de la CPU del chip, cuya utilización se redujo en un factor de 3.

Synaptics proporciona un conjunto de herramientas que permite a empresas como ID R&D optimizar sus tecnologías para la NPU, y aunque ID R&D es el primer socio de Synaptics en este sentido, la compañía trabajará con más socios en el futuro para aplicaciones fuera de la biometría de voz.

“Basándonos en nuestras discusiones con compañías de reconocimiento de voz, en realidad podemos hacer un motor de reconocimiento de voz de vocabulario en inglés completo en el dispositivo, dentro de la capacidad 1 TOPS de la NPU”, dijo Ganju. “Para que pueda tener un producto completamente fuera de línea con respecto al reconocimiento de voz ... por ejemplo, para productos donde los usuarios no lo conectan a su WiFi de inmediato, el reconocimiento de voz integrado puede ayudarlos a obtener una buena experiencia inmediata incluso antes está conectado ".

La primera compilación de software de ID R&D estará disponible en los kits de desarrollo VS600 de Synaptics a finales de este mes.

>> Este artículo se publicó originalmente el nuestro sitio hermano, EE Times.


Tecnología de Internet de las cosas

  1. Una solución de puerta de enlace de sensor IIoT a la nube
  2. Ecuaciones diferenciales
  3. Solución Minterm vs Maxterm
  4. Medición de pH
  5. Movilidad de fabricación:datos, voz, video y ubicación
  6. Preguntas y respuestas con un arquitecto de soluciones de Industria 4.0
  7. Los tres desafíos del desarrollo de soluciones de IoT
  8. Siemens y Bentley lanzan una solución para acelerar la digitalización de plantas
  9. La solución Azima DLI se enfoca en los programas de monitoreo del estado de la máquina
  10. La voz del cliente en la máquina CNC
  11. Integración HMI-PLC