Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Industrial Internet of Things >> Sensor

Recuperación de datos:el modelo de red neuronal del NIST encuentra objetos pequeños en imágenes densas

En un esfuerzo por capturar automáticamente datos importantes de artículos científicos, los científicos informáticos del Instituto Nacional de Estándares y Tecnología (NIST) han desarrollado un método para detectar con precisión objetos geométricos pequeños, como triángulos, dentro de gráficos densos y de baja calidad contenidos en datos de imágenes. Al emplear un enfoque de red neuronal diseñado para detectar patrones, el modelo NIST tiene muchas aplicaciones posibles en la vida moderna.

El modelo de red neuronal de NIST capturó el 97% de los objetos en un conjunto definido de imágenes de prueba, ubicando los centros de los objetos dentro de unos pocos píxeles de las ubicaciones seleccionadas manualmente. Los investigadores tomaron los datos de artículos de revistas que datan de principios del siglo XX en una base de datos de propiedades metálicas en el Centro de Investigación de Termodinámica (TRC) del NIST. A menudo, los resultados se presentaban solo en formato gráfico, a veces dibujados a mano y degradados mediante escaneo o fotocopia. Los investigadores querían extraer las ubicaciones de los puntos de datos para recuperar los datos sin procesar originales para un análisis adicional. Hasta ahora, dichos datos se extraían manualmente.

Las imágenes presentan puntos de datos con una variedad de marcadores diferentes, principalmente círculos, triángulos y cuadrados, tanto rellenos como abiertos, de diferentes tamaños y claridad. Dichos marcadores geométricos se usan a menudo para etiquetar datos en un gráfico científico. El texto, los números y otros símbolos, que pueden parecer falsamente puntos de datos, se eliminaron manualmente de un subconjunto de las figuras con un software de edición de gráficos antes de entrenar las redes neuronales.

Detectar y localizar con precisión los marcadores de datos fue un desafío por varias razones. Los marcadores son inconsistentes en claridad y forma exacta; pueden estar abiertos o llenos y, a veces, están borrosos o distorsionados. Algunos círculos parecen extremadamente circulares, por ejemplo, mientras que otros no tienen suficientes píxeles para definir completamente su forma. Además, muchas imágenes contienen parches muy densos de círculos, cuadrados y triángulos superpuestos.

Los investigadores buscaron crear un modelo de red que identificara los puntos de la trama al menos con la misma precisión que la detección manual:dentro de los 5 píxeles de la ubicación real en una trama del tamaño de varios miles de píxeles por lado.

Los investigadores del NIST adoptaron una arquitectura de red desarrollada originalmente por investigadores alemanes para analizar imágenes biomédicas, llamada U-Net. Primero, las dimensiones de la imagen se contraen para reducir la información espacial y, luego, se agregan capas de características e información de contexto para generar resultados precisos de alta resolución.

Para ayudar a entrenar la red para clasificar las formas de los marcadores y ubicar sus centros, los investigadores experimentaron con cuatro formas de marcar los datos de entrenamiento con máscaras, utilizando marcas centrales y contornos de diferentes tamaños para cada objeto geométrico.

Los investigadores descubrieron que agregar más información a las máscaras, como contornos más gruesos, aumentaba la precisión de clasificar las formas de los objetos, pero reducía la precisión de señalar sus ubicaciones en las gráficas. Al final, los investigadores combinaron los mejores aspectos de varios modelos para obtener la mejor clasificación y los errores de ubicación más pequeños. La alteración de las máscaras resultó ser la mejor manera de mejorar el rendimiento de la red, más eficaz que otros enfoques, como pequeños cambios al final de la red.

El mejor rendimiento de la red (una precisión del 97 % en la ubicación de los centros de los objetos) solo fue posible para un subconjunto de imágenes en las que los puntos de la trama estaban originalmente representados por círculos, triángulos y cuadrados muy claros. El rendimiento es lo suficientemente bueno como para que el TRC use la red neuronal para recuperar datos de gráficos en artículos de revistas más recientes.


Sensor

  1. CEVA:procesador de inteligencia artificial de segunda generación para cargas de trabajo de redes neuronales profundas
  2. Acceed:Switch gigabit de 12 puertos con 4 puertos SFP
  3. La monetización de los datos de la red móvil impulsa la eficiencia
  4. Cómo el ecosistema de red está cambiando el futuro de la granja
  5. Plataformas de redes digitales:el modelo de madurez de cinco etapas
  6. Una red Wi-Fi optimizada es fundamental para el éxito de Edge
  7. 5 consejos básicos de seguridad de red para pequeñas empresas
  8. Cámara captura imágenes del interior de objetos sólidos
  9. Señales de radio Imagen de objetos ocultos y veloces
  10. Uso de redes neuronales para obtener imágenes de rayos X más rápidas
  11. Red de sensores inalámbricos de largo alcance