Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Industrial Internet of Things >> Tecnología de Internet de las cosas

El éxito de la IA depende de la gestión de datos

Dave Smith

La inteligencia artificial (IA) está en todas partes en estos días, ya sea en la realidad o simplemente como una etiqueta publicitada para algunas decisiones simples basadas en reglas, y esto ha llevado a algunos problemas interesantes, dice David Smith, director de Tecnología GDPR, SAS Reino Unido e Irlanda .

El primero de ellos es la desconfianza, como señaló el presidente entrante de la Asociación Británica de Ciencias . Profesor Jim Al-Khalili:“Existe un peligro real de reacción pública contra la IA, potencialmente similar a la que tuvimos con la modificación genética [modificación genética] en los primeros días del milenio”. Al-Khalili destaca que para que AI alcance su máximo potencial se requiere más transparencia y participación pública.

El segundo problema potencial es el del control; Si los modelos realmente se dejan ejecutar sin supervisión ni control, existe la posibilidad de que se tomen malas decisiones. Un ejemplo de esto podría ser el "Flash Crash" en 2010 cuando el mercado de valores de EE. UU. Cayó alrededor del 9% durante 36 minutos. Aunque los reguladores culparon a un solo comerciante de engañar al mercado, los sistemas de negociación algorítmica fueron, al menos en parte, los culpables de la profundidad del colapso.

Aprovechar la IA para siempre

Dicho esto, la IA tiene un enorme potencial para el bien, ya sea proporcionando mejores diagnósticos de cáncer a través de una detección más eficiente de imágenes de tumores o protegiendo especies en peligro de extinción mediante la interpretación de imágenes de huellas de animales en la naturaleza. El desafío es garantizar que se obtengan estos beneficios, y aquí es donde entra en juego el marco FATE (Equidad, Responsabilidad, Transparencia y Explicable), que está diseñado para garantizar que la IA se utilice de manera adecuada. Me centraré en los aspectos de transparencia, donde la gestión de datos tiene el mayor impacto.

La IA solo puede ser tan buena como los datos que la alimentan, y para crear y usar una aplicación de IA se requieren varias fases específicas de datos:

Cada uno de estos agregará valor, pero también alterará potencialmente los resultados del proceso de IA. Por ejemplo, si el proceso de calidad de los datos elimina los valores atípicos, puede tener impactos muy diferentes. Si la eliminación de valores atípicos es apropiada, el resultado será un modelo que refleje muy bien la mayoría de los datos. Por otro lado, podría ignorar una circunstancia poco común pero crítica y perder la oportunidad de brindar un beneficio real.

Esto se demostró en el descubrimiento de los púlsares, un tipo de estrella de neutrones giratoria, de Dame Jocelyn Bell Burnell. Estaba examinando millas de datos impresos de un radiotelescopio y notó una pequeña señal en uno de cada 100.000 puntos de datos. A pesar de que su supervisor le dijo que era una interferencia provocada por el hombre, ella persistió y demostró su existencia al buscar con éxito señales similares en otros lugares. Si se hubieran eliminado los valores atípicos, ella no habría hecho el descubrimiento.

El viaje de los datos

La calidad de los datos también debe aplicarse para evitar decisiones embarazosas. Si Bank of America había verificado la validez de los datos de su Nombre, es posible que no hayan enviado una oferta de tarjeta de crédito a "Lisa Is A Slut McXxxxxx" ( su nombre está redactado. Ed.) en 2014. Habían adquirido los datos de Golden Key International Honor Society , que reconoce los logros académicos. Un individuo desconocido había editado su nombre en el registro de miembros.

Luego, el proceso continúa con transformaciones para preparar los datos para el modelado; Los sistemas de origen suelen estar muy normalizados y tienen información almacenada en varias tablas, mientras que a los científicos de datos les gusta analizar una única tabla cuadrada. A menudo necesitarán agregar variables derivadas para ayudar en su análisis. Por lo general, estos se definen inicialmente en un entorno de preparación de datos ad-hoc por el científico de datos, pero deberán trasladarse a un entorno más controlado para fines de producción.

El impacto de esta etapa de transformación de datos puede ser enorme. En primer lugar, es importante comprender qué fuentes de datos se utilizan en el análisis. Esto puede estar relacionado con cuestiones normativas, como si se utilizan datos personales o simplemente para garantizar que se accede a la fuente de datos correcta. En segundo lugar, es importante comprender si la transformación ha sido adecuada y se ha implementado correctamente; Los errores en la implementación pueden ser tan dañinos como los datos de mala calidad.

El último proceso de datos que impacta directamente en la IA es la implementación, lo que garantiza que se ingresen los datos correctos en el modelo y utilice los resultados para tomar decisiones que impacten directamente en el desempeño de las organizaciones. Los modelos tienen una vida útil definida durante la cual predicen con precisión el mundo real, por lo que si lleva demasiado tiempo implementar los modelos en producción, no entregarán todo su valor.

Un proceso de implementación organizado también es un componente necesario para cumplir con los requisitos del artículo 22 del RGPD. Este artículo impide el uso de perfiles analíticos de datos personales a menos que se cumplan condiciones estrictas (por ejemplo, consentimiento completo). La implementación controlada permite una descripción general de qué datos se han utilizado en el proceso de IA y qué modelos analíticos se han aplicado a los datos en un momento dado. Esto es fundamental para determinar si la regulación se ha visto comprometida.

En general, la gestión de datos es fundamental para que la IA pueda alcanzar su verdadero potencial. Ser capaz de comprender cómo se logra el procesamiento de datos es una parte crucial para defender la transparencia, uno de los pilares principales de una IA justa, confiable y efectiva.

El autor de este blog es David Smith, director de Tecnología GDPR, SAS Reino Unido e Irlanda.


Tecnología de Internet de las cosas

  1. Gestión de datos de IoT en pruebas de invierno
  2. Cómo la Internet industrial está cambiando la gestión de activos
  3. Ponerse manos a la obra con IoT
  4. Seis elementos esenciales para aplicaciones exitosas informadas por sensores
  5. Desafíos clave en la gestión de la privacidad de datos para empresas de 2021-23
  6. Cómo crear una estrategia de inteligencia empresarial exitosa
  7. Herramienta de vistas previas de Ascend para simplificar la gestión de canalización de datos
  8. Encuesta encuentra tasas de crecimiento de datos que superan las capacidades de gestión
  9. Habilitación de IA generalizada en todas las áreas operativas de telecomunicaciones
  10. Los líderes empresariales deben hacer de los Data Fabrics una prioridad en 2022
  11. La fábrica inteligente de Industry 4.0 tiene que ver con esos datos