Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Industrial Internet of Things >> Tecnología de Internet de las cosas

Por qué los almacenes de datos tradicionales no alcanzan el análisis en tiempo real

Las organizaciones basadas en datos tienen éxito o fracasan en función de su capacidad para tomar decisiones basadas en la información más reciente y actualizada. Ya sea que esté optimizando las cadenas de suministro, detectando fraudes en transacciones financieras o personalizando la experiencia del cliente en tiempo real, la actualización de los datos es primordial.

Sin embargo, para muchas organizaciones, este Santo Grial de la “inmediatez de los datos” sigue siendo difícil de alcanzar. Siguen dependiendo de los almacenes de datos tradicionales u otros almacenes de datos heredados (herramientas potentes creadas para el procesamiento por lotes y el análisis histórico), pero no están bien equipados para manejar las demandas del análisis en tiempo real. ¿El resultado? Se están tomando decisiones comerciales críticas sobre datos que ya no están actualizados, lo que genera oportunidades perdidas, resultados subóptimos y la incapacidad de seguir el ritmo de la competencia.

Si se encuentra en una situación en la que la actualización de los datos es fundamental para su caso de uso y todavía utiliza un almacén de datos como su principal almacén de análisis, es probable que no esté aprovechando todos los beneficios de la información en tiempo real. De hecho, probablemente esté incurriendo en importantes latencias de datos y costos operativos que hacen que sus iniciativas de datos en tiempo real sean insostenibles a largo plazo.

El almacén de datos nunca fue diseñado para tiempo real

Para comprender por qué los almacenes de datos no son suficientes para el análisis en tiempo real, debemos observar las principales diferencias arquitectónicas entre estos sistemas heredados y las bases de datos modernas de análisis en tiempo real.

Los almacenes de datos están optimizados para el procesamiento por lotes y el análisis histórico. Se destacan en agregar grandes volúmenes de datos de diversas fuentes, transformarlos y limpiarlos, y luego cargarlos en un repositorio centralizado para informes e inteligencia empresarial. Este enfoque orientado a lotes funciona bien para casos de uso donde la puntualidad no es un factor crítico, como informes de ventas mensuales o análisis financieros trimestrales.

Sin embargo, el diseño inherente de un almacén de datos introduce una latencia de datos significativa. Los datos normalmente se cargan en el almacén de forma periódica:cada hora, día, semana o mes. Esto significa que cuando los datos están disponibles para su análisis, ya están desactualizados, a veces por horas o incluso días. En un entorno empresarial acelerado donde cada segundo cuenta, este retraso puede marcar la diferencia entre aprovechar una oportunidad y perderla por completo.

Además, los almacenes de datos no están diseñados para manejar flujos de datos de alta velocidad ni admitir consultas de baja latencia. A medida que aumentan los volúmenes de datos y la concurrencia de usuarios, los almacenes de datos luchan por proporcionar los tiempos de respuesta inferiores a un segundo necesarios para la toma de decisiones en tiempo real. Las estructuras subyacentes de almacenamiento e indexación de un almacén de datos están optimizadas para la carga y agregación masiva de datos, no para la rápida ingesta y consulta de datos granulares en tiempo real.

El coste de los datos obsoletos

Las consecuencias de depender de un almacén de datos para realizar análisis en tiempo real pueden ser graves. Considere los siguientes escenarios:

En cada uno de estos ejemplos, el costo de los datos obsoletos se puede medir no sólo en la pérdida de ingresos y la insatisfacción del cliente, sino también en el costo de oportunidad de las ventajas estratégicas perdidas. Las organizaciones que no pueden actuar basándose en la información más reciente siempre quedarán rezagadas respecto de sus competidores más ágiles.

Además, los costos operativos asociados con el mantenimiento de una infraestructura de análisis en tiempo real basada en un almacén de datos pueden ser prohibitivos. La necesidad de procesos ETL adicionales, replicación de datos y mecanismos complejos de sincronización de datos crea una carga administrativa significativa y aumenta el costo total de propiedad (TCO).

Bases de datos analíticas en tiempo real

Para superar las limitaciones de los almacenes de datos para casos de uso en tiempo real, las organizaciones recurren cada vez más a bases de datos especializadas en análisis en tiempo real como Apache Pinot. Estas soluciones especialmente diseñadas están diseñadas desde cero para manejar los requisitos únicos de análisis de baja latencia y alta concurrencia en datos en rápido movimiento.

A diferencia de los almacenes de datos, las bases de datos de análisis en tiempo real como Pinot están optimizadas para la ingesta continua de datos y consultas en tiempo real. Pueden ingerir e indexar flujos de datos en milisegundos, lo que permite tiempos de respuesta de consultas inferiores a un segundo incluso con miles de millones de registros. Esto permite a las organizaciones tomar decisiones basadas en los datos más recientes posibles, liberando el verdadero potencial del análisis en tiempo real.

Además, las bases de datos de análisis en tiempo real están diseñadas para escalar horizontalmente, manejando volúmenes de datos crecientes y la concurrencia de usuarios sin sacrificar el rendimiento. Esta escalabilidad es crucial para aplicaciones de misión crítica orientadas al usuario donde miles de usuarios pueden estar consultando el sistema simultáneamente.

Pero las ventajas de las bases de datos analíticas en tiempo real van más allá de las capacidades técnicas. También ofrecen importantes beneficios operativos y de costos –

Cuándo elegir una base de datos de análisis en tiempo real en lugar de un almacén de datos

La decisión de utilizar una base de datos analítica en tiempo real como Apache Pinot en lugar de un almacén de datos tradicional debe basarse en una evaluación cuidadosa de los requisitos y casos de uso específicos de su organización. Como regla general, si la actualización de los datos es fundamental para los resultados de su negocio y se trata de flujos de datos de alta velocidad, una base de datos analítica en tiempo real probablemente sea la mejor opción.

A continuación se muestran algunos escenarios comunes en los que destaca una base de datos de análisis en tiempo real:

Por el contrario, los almacenes de datos pueden seguir siendo la mejor opción para casos de uso donde la actualización de los datos es menos crítica, como informes históricos, inteligencia empresarial o cargas de trabajo de ciencia de datos.

En última instancia, la clave es comprender sus requisitos específicos y elegir la herramienta adecuada para el trabajo. Intentar forzar un ajuste de un almacén de datos en un caso de uso de análisis en tiempo real conducirá inevitablemente a un rendimiento subóptimo, mayores costos y oportunidades perdidas.

Próximos pasos

A medida que el ritmo de los negocios continúa acelerándose, la necesidad de obtener información sobre datos en tiempo real nunca ha sido más apremiante. Las organizaciones que puedan aprovechar el poder del ahora (la capacidad de convertir los datos en acción a la velocidad del pensamiento) serán las que prosperen en la era digital.

Para ayudarlo a profundizar en este tema y obtener más claridad, hemos preparado un libro electrónico para usted:"Adáptese o sea superado:la ventaja competitiva de los datos en tiempo real". Descárguelo hoy y defienda en su organización la adopción de una base de datos de análisis en tiempo real como Apache Pinot como la herramienta adecuada para todas sus necesidades de análisis de cara al usuario en tiempo real.


Tecnología de Internet de las cosas

  1. 4 aplicaciones de seguimiento de activos M2M para vigilar
  2. Los cinco mejores seminarios web de 2016
  3. IA subcontratada y aprendizaje profundo en la industria de la salud:¿está en riesgo la privacidad de los datos?
  4. Tendencias 3DP, Blockchain, IoT y VSaaS para Covid-19:Parte II
  5. Honeywell y SKF lanzan el proyecto de Internet industrial de las cosas
  6. Arquitectura de precisión RTLS para el éxito
  7. ¿Por qué las fábricas a gran escala están adoptando la solución de medición de energía inteligente de Biz4Intellia?
  8. El secreto para comenzar tu carrera
  9. ¿Por qué el monitoreo de máquinas es el primer paso para la implementación de IoT industrial?
  10. Industrial IoT vs SCADA:¿Cuál es más poderoso?
  11. ¿Por qué las grandes corporaciones estadounidenses luchan en China?