Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Manufacturing Technology >> Tecnología Industrial

Realidad o ficción:¿Qué historia le cuentan sus datos?

En el año 30 000 a. C., nuestros antepasados ​​pintaron historias en las paredes de las cuevas sobre su vida cotidiana, y hacia el año 700 a. C. tuvimos nuestra primera historia impresa:Gilgamesh. Avancemos rápidamente hasta 2021, y hemos estado co-creando historias junto con AI durante más de media década. Pero cuando el orden del día es la inteligencia empresarial precisa, las empresas quieren estar seguras de que sus sistemas de inteligencia artificial y aprendizaje automático no se están tomando la libertad artística y escupiendo un cuento falso.

Esto es especialmente cierto ahora que la toma de decisiones dirigida por IA y ML se encuentra en su nivel más alto de adopción hasta la fecha e incluso los ejecutivos más reacios están comenzando a ver los inmensos beneficios que se pueden obtener de un enfoque estratégico centrado en los datos. A medida que aumenta la confianza en la promesa de IA y ML, la precisión es fundamental. La pregunta sigue siendo lo más importante para muchos:“¿Cómo podemos saber si nuestros datos nos cuentan la historia completa, y una que se basa en hechos? ¿Qué necesitamos saber para confiar en nuestros modelos?”

Datos absolutamente limpios

Cuando un sistema de aprendizaje automático ofrece una predicción inexacta, podemos buscar a un culpable:los datos. Salvo eventos de cisne negro, los datos son el principio, el medio y el final de cualquier sistema predictivo. Podría ser que simplemente no hubiera suficientes datos para entrenar el sistema de manera confiable o basar sus predicciones, en cuyo caso más puntos de datos pueden resolver el problema. Por lo general, algo como esto se detectaría en las primeras etapas de la ideación de un modelo y, casi con seguridad, antes de la implementación, al menos en la medida en que evite predicciones muy imprecisas. Sin embargo, el culpable más probable es que los datos iniciales no eran lo suficientemente "limpios". Lo suficientemente limpio es relativo. Los requisitos de datos para algunos proyectos son similares a "¿Están mis zapatillas lo suficientemente limpias para ir al supermercado?" Otros, especialmente en sistemas críticos y aquellos que involucran la vida, la seguridad y el bienestar, son más como escenarios "libres de polvo, brillo de saliva, brillo de desfile en el que podría revisar sus dientes" cuando se trata de cuán limpios deben ser los datos. para realizar la tarea de manera confiable (y ética).

Entonces, ¿qué ensucia los datos? La historia corta es información inexacta o sesgada.

Etiquetas rotas, modelos rotos

Estos podrían ser datos etiquetados incorrectamente, datos que tienen la información incorrecta en el campo incorrecto o en un formato incorrecto, p. 27 de diciembre de 2015 en lugar de 27/12/15 o 27/12/2015. Mientras que la primera opción podría simplemente arrojar un error o ser ignorada, intercambiar los dos últimos formatos de fecha podría tener serias repercusiones en la precisión. Y las fechas no son todo lo que puede afectar el formato no válido:horas, SKU, texto donde deberían estar los números, números donde debería estar el texto y todos los flujos de datos especiales que salen de los equipos de la planta como anulaciones, alarmas, cargas, velocidades, feeds, etc. El punto es que sin una estructura confiable y consistente, los datos pueden volverse confusos y conducir a información inexacta.

Con MachineMetrics, las empresas pueden aprovechar nuestro motor de transformación de datos automatizado que estandariza y formatea una amplia gama de tipos de datos para facilitar el análisis. Puede manejar valores de sensor personalizados, estado de la máquina, modos, alarmas, anulaciones, carga, velocidades, alimentaciones, parámetros de PMC, diagnósticos y más.

¿Puedes confiar en tus fuentes?

También es importante considerar la veracidad y precisión de las fuentes de datos que se utilizan, especialmente si esas fuentes son humanas. Los humanos no son las criaturas más precisas. Redondeamos, olvidamos y falsificamos los números. Nos volvemos perezosos, cansados, hambrientos o distraídos. Por la naturaleza del uso de fuentes de datos humanos, los datos estarán sucios de una forma u otra. Aquí es donde es importante observar las tolerancias. Por ejemplo, los operadores de máquinas podrían estar agregando datos sobre el estado del equipo que utilizan. Al brindar información sobre el tiempo de inactividad, las razones enumeradas pueden ser precisas, mientras que el tiempo es más una estimación. Esto conduce a un sistema predictivo menos preciso, ya que las respuestas que genera también están más cerca de las estimaciones de lo que podrían haber sido si se proporcionaran datos verdaderamente precisos.

Este es otro escenario donde se deben considerar tolerancias realistas. ¿Segundos o intervalos de media hora? En el caso del abastecimiento de datos de máquinas, incluso podría buscar nanosegundos o menos para algunos casos de uso. Independientemente de la tolerancia que se considere razonable para el proyecto, es importante hacer cumplir esa tolerancia y asegurarse de que cualquier entrada de datos al sistema se encuentre dentro de esos parámetros de precisión.

El adaptador de datos de alta frecuencia de MachineMetrics captura datos de la máquina a 1 kHz (en comparación con un 1 Hz estándar, es decir, 1000 veces más rápido) para que nunca pierda el ritmo, sin importar el nivel de precisión que requiera su aplicación.

Aquí también es donde las empresas también deberían buscar el potencial de sesgo. Las mentiras por omisión todavía conducen a predicciones de cuentos de hadas. ¿Recopilan sus fuentes de datos lo suficientemente amplia como para mostrar la imagen completa o son propensas a sesgos como consecuencia de los métodos de recopilación utilizados? Por ejemplo, si está tratando de calcular el salario promedio de un trabajador de la línea de producción, pero todos los encuestados eran hombres, es probable que tenga una cifra sesgada en comparación con si encuestara tanto a hombres como a mujeres para obtener una idea más clara y precisa. imagen más precisa. La búsqueda activa de posibles descuidos como este puede conducir a datos más limpios y predicciones más precisas.

Contexto y Complejidad

Cuanto más complejo es un sistema, más espacio hay para imprecisiones, inconsistencias, riesgos y fallas generales en los datos y la lógica que lo sustenta cuando intenta traducirlo en algo que pueda usarse para el análisis. ¿Cuántos pasos hay en el proceso en el que está tratando de recopilar datos? ¿Tiene el conocimiento de la industria para ayudarlo a dar contexto a los datos sin procesar? Por ejemplo, una máquina que "se apaga" varias veces en cuestión de minutos con una producción exitosa en el medio es menos probable que sea una verdadera producción, más bien es indicativo de pruebas para garantizar que cualquier problema que inicialmente haya causado el tiempo de inactividad se resuelva por completo, se vuelva a calibrar y listo para reanudar real producción. Sin embargo, dejar estos números en el conjunto de datos tal como se ingresaron podría causar serias imprecisiones que podrían ser difíciles de detectar para el ojo inexperto.

Esto no significa que su equipo de ciencia de datos tenga que ser el máximo experto en todo en su industria. Sin embargo, significa que tener canales en los que los expertos puedan agregar contexto es fundamental. Por ejemplo, con MachineMetrics, los operadores de máquinas están equipados con un dispositivo de tableta en el taller, justo en su maquinaria. Pueden agregar rápida y fácilmente contexto humano a los datos numéricos para aumentar la precisión en la etapa de análisis. Sin este tipo de canal de contexto, puede convertirse en un juego de adivinanzas para determinar qué números deben arrojarse al bote y cuáles deben descartarse.

Transformaciones sin pérdidas

Cuando transforma una cosa en otra cosa, básicamente siempre hay algún grado de pérdida, por mínima que sea, ya sea transformando el mineral en acero, el algodón en textiles o los datos en un formato para el análisis, es importante determinar cuánta pérdida es aceptable y cuánto. mucho es prevenible. Comenzar con datos limpios y precisos es un primer paso vital en un análisis limpio y preciso. Más allá de esa etapa, es necesario considerar qué herramientas usará y para qué aplicaciones, la probabilidad de pérdida de fidelidad y hasta qué punto esto es aceptable (o irrelevante). Esto lleva directamente a comprender qué es lo que está tratando de hacer con sus datos y con sus modelos, qué problemas está tratando de resolver y el nivel de precisión requerido para resolverlos de manera efectiva.

En MachineMetrics, nos aseguramos de que sus datos le proporcionen toda la verdad y nada más. Somos expertos de la industria que comprenden la profundidad, la amplitud y el tipo de datos que necesita para resolver sus problemas más apremiantes, ya sea el tiempo de inactividad de la máquina, la optimización de la producción o una miríada de otras opciones, utilizando un enfoque basado en datos. Usamos formatos simples y digeribles para compartir y analizar que conservan su integridad y fidelidad, incluso en tiempo real. MachineMetrics simplifica la tarea de integrar los datos del piso de producción con la toma de decisiones del mundo real a través de un proceso comprobado, implementado en un lenguaje sencillo y con herramientas tan fáciles que incluso personas sin conocimientos técnicos pueden instalarlas fácilmente, para un servicio que ha llevado a nuestros clientes al ROI en menos de una semana. Para ver qué tipo de preguntas puede responder MachineMetrics para su negocio o para reservar una demostración, comuníquese con nosotros en cualquier momento aquí.


Tecnología Industrial

  1. Sentir o no sentir:los beneficios de IIoT para su fábrica
  2. Lubricación de equipos de fabricación:realidad frente a ficción
  3. ¿Qué componentes básicos de IoT necesita para su proyecto?
  4. Cervoz:protege tus datos contra la pérdida repentina de energía
  5. Poniendo tus datos a trabajar
  6. ¿Sabe cuánto vale su negocio?
  7. ActiveCare Direct frente a CareTrack:¿cuál es el adecuado para la gestión de su flota?
  8. 10 razones por las que deberías incluir un sistema de adquisición de datos en tu empresa
  9. ¿Estás listo para una Smart Factory?
  10. ¿Cómo sabe si su proyecto de Big Data tendrá éxito?
  11. Los 30 términos principales que debe mantener en el glosario de su centro de datos