13 fallas importantes de software que redefinieron los estándares de la industria
No importa cuántas pruebas minuciosas realicen los ingenieros o cuántas noches de insomnio pasen los desarrolladores codificando hasta el amanecer, un solo error aún puede causar una falla total del sistema. Desde fallos de software que cuestan miles de millones hasta errores críticos que provocan accidentes mortales, las consecuencias de un desarrollo deficiente de software pueden ser catastróficas.
¿Sabía que la mala calidad del software cuesta a las empresas estadounidenses aproximadamente 2 billones de dólares al año, siendo las fallas operativas del software el principal contribuyente a estas pérdidas?
Algunas de las razones más comunes detrás de las fallas del software incluyen:
- Definición arquitectónica inadecuada y diseño deficiente de bajo nivel.
- Programaciones poco realistas o fechas límite establecidas sin suficientes datos y análisis.
- No anticipar y adaptarse a los requisitos cambiantes.
- Sobrecargar proyectos con personal excesivo en un intento de comprimir los cronogramas.
- Negociaciones con las partes interesadas basadas en la intuición o impulsadas emocionalmente.
- Falta de comunicación, egos en conflicto y dinámicas de equipo negativas.
A continuación se detallan las principales fallas de software que provocaron vergüenza y pérdidas financieras masivas. En casos extremos, los errores de software incluso han costado vidas, como en los incidentes de sobredosis de radiación Therac-25.
13. Violación de datos de MOVEit
En mayo de 2023, se produjo una importante filtración de datos que involucró a MOVEit, un software de transferencia de archivos administrado desarrollado por Progress Software. Esta falla permitió el acceso no autorizado a datos confidenciales, lo que provocó una serie de ciberataques que afectaron a miles de empresas en todo el mundo.
Motivo del error:vulnerabilidad de inyección SQL
La infracción se ejecutó principalmente mediante ataques de inyección SQL en servidores públicos, lo que permitió a los atacantes extraer datos sin ser detectados. Más específicamente, la falla permitió a los atacantes implementar un shell web, denominado "LemurLoot", que facilitó el acceso no autorizado y el robo de datos confidenciales almacenados en las bases de datos de MOVEit.
Coste total de la infracción:15.800 millones de dólares
La violación afectó a más de 2.700 organizaciones en todo el mundo y comprometió los datos personales de aproximadamente 95,8 millones de personas. Según el análisis de costes de la vulneración de datos de IBM, el coste medio por registro comprometido es de 165 dólares.
12. Sistema de pasaportes británico (1999)
En 1999, la Agencia de Pasaportes del Reino Unido introdujo un nuevo sistema de procesamiento computarizado para agilizar las solicitudes de pasaportes. Desarrollado por Siemens, el sistema tenía como objetivo modernizar el proceso y mejorar la eficiencia. Sin embargo, debido a fallos en el software y en el sistema, la implementación provocó retrasos masivos, lo que dejó a miles de ciudadanos del Reino Unido sin poder obtener sus pasaportes a tiempo para viajar.
Razón del fracaso:pruebas inadecuadas
El sistema no se probó adecuadamente en condiciones del mundo real, lo que provocó cuellos de botella durante su implementación. Además, el gobierno del Reino Unido introdujo nuevos requisitos de pasaporte para niños casi al mismo tiempo, lo que aumentó sustancialmente el volumen de solicitudes, algo que el sistema no estaba preparado para manejar.
Coste total del error:20 millones de dólares
El fracaso obligó al gobierno del Reino Unido a contratar personal adicional, trabajar horas extras y compensar a los ciudadanos afectados, lo que provocó pérdidas financieras estimadas en 20 millones de dólares. Además, miles de personas se perdieron sus vacaciones y viajes de negocios, lo que aumentó la indignación pública.
11. Marinero 1
Atlas Agena con Mariner 1 | Crédito de la imagen:Wikimedia
Lanzada en julio de 1962, Mariner 1 fue la primera misión interplanetaria de la NASA, destinada a sobrevolar Venus y transmitir datos científicos a la Tierra. Desafortunadamente, la misión terminó prematuramente cuando la nave espacial fue destruida 293 segundos después del despegue debido a un mal funcionamiento del sistema de guía.
Razón del fracaso:falta una barra superior
Poco después del despegue, el cohete comenzó a desviarse de su rumbo. Esta desviación se debió a un fallo en el software de guiado. Específicamente, una barra superior faltante (un símbolo que indica un valor promedio) en las ecuaciones de guía escritas a mano provocó que se enviaran comandos de guía incorrectos al cohete. En consecuencia, el cohete se desvió de su rumbo y el responsable de seguridad del campo de tiro ordenó su destrucción para evitar posibles peligros.
Coste total del error:18,5 millones de dólares
La pérdida del Mariner 1 resultó en un revés financiero estimado de 18,5 millones de dólares en 1962, equivalente a aproximadamente 194 millones de dólares en la actualidad.
10. Mi destino
Mydoom, detectado por primera vez el 26 de enero de 2004, es uno de los gusanos informáticos más infames y dañinos jamás creados. Se propagó a través de archivos adjuntos de correo electrónico y redes peer-to-peer, infectando millones de computadoras en todo el mundo. En su apogeo, Mydoom representó casi el 8,3% de todos los correos electrónicos enviados globalmente, lo que lo convierte en el gusano de correo electrónico que se propaga más rápidamente en la historia.
Razón detrás del ataque:Desconocido
Si bien se desconoce el origen exacto de Mydoom, algunas teorías sugieren que fue creado por un grupo contratado para atacar al Grupo SCO, que en ese momento estaba involucrado en disputas legales sobre el software Linux. A diferencia de muchos otros gusanos, Mydoom no parecía tener un motivo financiero.
Coste total:entre 38.000 y 50.000 millones de dólares
El brote provocó daños por miles de millones de dólares, incluidos costos de seguridad, pérdida de productividad y esfuerzos de mitigación. Las estimaciones sugieren que el impacto financiero total fue de entre 38 mil millones de dólares y 50 mil millones de dólares a nivel mundial.
9. Colapso del Coliseo de Hartford
Fuente de la imagen:Wikispaces
El 18 de enero de 1978, el techo del Hartford Civic Center Coliseum en Hartford, Connecticut, se derrumbó debido a una falla estructural. El techo de 10.000 toneladas cayó sobre la zona de gradas del estadio, apenas seis horas después de albergar un partido de baloncesto con más de 4.700 espectadores. Afortunadamente, en ese momento no había nadie dentro.
Razón del fracaso:cálculos CAD defectuosos y errores de diseño estructural
Las investigaciones revelaron que el colapso fue una combinación de errores de cálculo de ingeniería y errores de software utilizados en el proceso de diseño estructural. Los ingenieros utilizaron los primeros programas informáticos para modelar la distribución de la tensión, pero el software no tuvo en cuenta ciertas condiciones de carga, lo que llevó a niveles de tensión subestimados en las uniones clave.
El sistema de celosía tenía un arriostramiento diagonal inadecuado, lo que provocaba una tensión de flexión excesiva. El peso de la nieve y el hielo acumulados (de una tormenta invernal) empujó la estructura más allá de sus límites.
Costo total:70 millones de dólares
El colapso dañó la confianza del público en la ingeniería asistida por computadora y condujo a regulaciones más estrictas en los códigos de construcción. Además, se presentaron demandas importantes contra la empresa de diseño, las aseguradoras y los contratistas.
8. Orbitador climático de Marte
Mars Climate Orbiter fue una sonda espacial robótica lanzada por la NASA en 1998 para estudiar la atmósfera, el clima y los cambios en la superficie marcianos. Después de 286 días de lanzamiento, la nave espacial se quemó en la atmósfera de Marte en lugar de entrar en órbita como estaba previsto.
Razón del error:error de conversión de unidades
El fallo se produjo debido a un error de conversión de unidades simple pero catastrófico entre dos equipos de la NASA:Lockheed Martin (el contratista que construyó la nave espacial), que utilizó unidades imperiales para los cálculos de fuerza, y el Laboratorio de Propulsión a Chorro de la NASA, que controló la misión, esperando unidades métricas.
Dado que estas unidades nunca se convirtieron adecuadamente, el sistema de navegación del Orbiter calculó mal su trayectoria, lo que provocó que entrara en la atmósfera de Marte a 35 millas en lugar de las 140 millas previstas. La baja altitud provocó que las fuerzas aerodinámicas destruyeran la sonda.
Costo total:327 millones de dólares
El costo total de la misión fue de aproximadamente 327,6 millones de dólares, que incluyeron el desarrollo de la nave espacial, los gastos de lanzamiento y las operaciones de la misión.
7. IRS:Falta de sistema de detección de fraude
En 1994, el Sistema de Impuestos Internos (IRS) introdujo el Sistema Electrónico de Detección de Fraude (EFDS) para detectar y prevenir declaraciones de impuestos fraudulentas. Con el tiempo, el EFDS quedó obsoleto y tuvo dificultades para seguir el ritmo de la evolución de las tácticas de fraude. Al reconocer estos inconvenientes, el IRS comenzó a trabajar en el Programa de Revisión de Devoluciones (RRP) en 2009, con el objetivo de mejorar las capacidades de detección de fraude y reemplazar el EFDS.
Razón del fracaso:retrasos en la implementación
El PRR sufrió retrasos y no estuvo plenamente operativo como se esperaba. Como resultado, durante la temporada de presentación de impuestos de 2006, el IRS operó sin un sistema integral de detección de fraude por adelantado, dejando al sistema tributario vulnerable a la explotación.
Costo total:más de 4 mil millones de dólares
En 2012, el fraude fiscal relacionado con el robo de identidad generó aproximadamente $4 mil millones en reembolsos fraudulentos. En 2013, el robo de identidad fiscal había afectado a 770.000 contribuyentes.
6. Nave espacial en racimo
La Misión Cluster fue un proyecto de la Agencia Espacial Europea que comprendía cuatro naves espaciales idénticas desarrolladas para estudiar la magnetosfera de la Tierra. Estos satélites debían ser lanzados a bordo del primer vuelo del cohete Ariane 5 el 4 de junio de 1996. Sin embargo, sólo 37 segundos después del despegue, el cohete explotó en el aire, destruyendo los cuatro satélites.
Razón detrás del error:error de desbordamiento de enteros
El cohete Ariane 5 utilizó un software diseñado originalmente para el Ariane 4, pero su aceleración más rápida no se tuvo en cuenta en el código. Como resultado, el software intentó convertir un número de punto flotante de 64 bits en un entero de 16 bits. Debido a la mayor aceleración de Ariane 5, el valor excedió el límite de almacenamiento, lo que provocó una falla del sistema.
Coste total del error:370 millones de dólares
La destrucción de la nave espacial Cluster provocó una pérdida financiera superior a los 370 millones de dólares. Esta cifra incluye el desarrollo y lanzamiento de las cuatro naves espaciales. Más allá del impacto monetario, el fracaso retrasó investigaciones científicas críticas sobre la magnetosfera de la Tierra.
5. La división larga de Pentium
En 1994, se descubrió una falla crítica en el microprocesador Pentium de Intel, que causaba errores en los cálculos de división de punto flotante. El error, más tarde conocido como error Pentium FDIV, provocaba resultados decimales incorrectos para determinadas operaciones de división. Esto generó una preocupación generalizada entre los investigadores y las empresas que dependen de cálculos precisos.
Había alrededor de 5 millones de chips defectuosos en circulación e Intel finalmente decidió reemplazar todos los chips para cualquiera que se quejara. Más tarde, Intel convirtió algunos de sus procesadores defectuosos en llaveros.
Razón detrás del fallo:Algoritmo de división defectuoso en la unidad de coma flotante
El error fue causado por una entrada faltante en la tabla de búsqueda en el algoritmo de división basado en hardware del chip. Ciertas divisiones de punto flotante arrojaron resultados incorrectos más allá del octavo decimal.
Sin embargo, el error era raro y ocurría sólo una vez en aproximadamente nueve mil millones de divisiones aleatorias de punto flotante. Por ejemplo, dividir 4.195.835,0 entre 3.145.727,0 dio como resultado 1,333739068902037589 en lugar del 1,333820449136241002 correcto:un error del 0,006 %.
Pérdida estimada:475 millones de dólares
Intel sufrió pérdidas de 475 millones de dólares debido al retiro y reemplazo de chips defectuosos. Además, el incidente dañó gravemente la reputación de la empresa, lo que llevó a Intel a adoptar una mayor transparencia en futuros diseños de procesadores.
4. Caída de Wall Street 1987
El 19 de octubre de 1987 (también conocido como Lunes Negro), el Dow Jones Industrial Average (DJIA) cayó 508 puntos, perdiendo el 22,61% de su valor total, y el S&P 500 cayó un 20,4%. Esta fue la mayor pérdida que Wall Street haya experimentado en un solo día.
Razón detrás de la caída:algoritmos comerciales automatizados
Los grandes inversores institucionales utilizaron sistemas de comercio de programas para vender acciones cuando los mercados cayeron, acelerando la crisis. Estos sistemas no tuvieron en cuenta las condiciones del mercado impulsadas por el pánico, lo que provocó un ciclo de retroalimentación de ventas que se refuerza a sí mismo.
Varias empresas utilizaron seguros de cartera, una estrategia algorítmica que vendía contratos de futuros para protegerse contra pérdidas.
A medida que el mercado caía, estos algoritmos provocaron aún más ventas, empeorando la espiral descendente.
Las pérdidas mundiales se estimaron en 1,71 billones de dólares
Si bien el impacto económico inmediato fue menos grave de lo que se temía inicialmente, la crisis provocó una mayor volatilidad del mercado y provocó cambios regulatorios para evitar incidentes futuros.
3. Y2K
El error Y2K, también conocido como error del Milenio, surgió debido a cómo se almacenaban las fechas en sistemas más antiguos. Muchos programas informáticos heredados representaban años utilizando dos dígitos (por ejemplo, “99” para 1999) en lugar de cuatro dígitos (“1999”).
A medida que se acercaba el año 2000, crecía la preocupación de que las computadoras interpretaran “00” como 1900 en lugar de 2000, lo que provocaría cálculos incorrectos y posibles perturbaciones económicas en industrias como la banca, la atención médica y la aviación.
Razón detrás del flujo:memoria limitada en la informática temprana
Las computadoras más antiguas fueron diseñadas con memoria y almacenamiento mínimos, por lo que los programadores usaron años de dos dígitos para ahorrar espacio. Esta elección de diseño miope se convirtió en un problema enorme décadas después.
Coste total de la solución:300 mil millones de dólares
Las estimaciones sugieren que los esfuerzos para solucionar el problema cuestan más de 300 mil millones de dólares a nivel mundial. Sólo Estados Unidos gastó aproximadamente 100 mil millones de dólares en preparación para el año 2000. Estas inversiones cubrieron actualizaciones de software, reemplazos de sistemas, pruebas y planificación de contingencias.
2. Tratamiento del cáncer y radioterapia mortal
Therac-25 era una máquina de radioterapia controlada por computadora desarrollada por Atomic Energy of Canada Limited (AECL) para tratar el cáncer. Entre 1985 y 1987, el dispositivo administró sobredosis masivas de radiación a al menos seis pacientes. Estos pacientes recibieron dosis de radiación 100 veces superiores al nivel previsto, exponiéndolos a quemaduras mortales por radiación y daños graves a los tejidos.
La causa:Condición de carrera en el software
El Therac-25 dependía completamente del software para su seguridad, pero un error en el código permitió que ocurrieran condiciones peligrosas. El dispositivo tenía dos modos:modo de rayos X de baja potencia y modo de haz de electrones de alta potencia. Si un técnico cambiaba rápidamente los modos antes de que el dispositivo comenzara el tratamiento, una condición de carrera en el software podría dejar el atenuador fuera de lugar, permitiendo que un rayo de electrones mortal golpeara directamente a los pacientes.
Costo Total:3 vidas
Al menos tres pacientes murieron por sobredosis de radiación, mientras que otros sufrieron lesiones de por vida, incluidas quemaduras graves, amputaciones y daños a órganos. Se presentaron múltiples demandas contra AECL, que resultaron en acuerdos financieros.
1. Fallo del misil Patriot
En febrero de 1991 (durante la primera Guerra del Golfo), un sistema de misiles Patriot estadounidense en Dharan, Arabia Saudita, no logró interceptar ni rastrear un misil Scud iraquí entrante. El Scud se estrelló contra un cuartel del ejército americano.
Motivo del error:error de sincronización acumulado debido a la precisión del punto flotante
El sistema de misiles Patriot se basaba en un registro de punto flotante de 24 bits para seguir el tiempo. Sin embargo, un error de redondeo acumulado provocó que su reloj interno se desviara 0,34 segundos después de funcionar continuamente durante más de 100 horas. Dado que un misil Scud viaja a unos 1.676 metros por segundo, este pequeño error de sincronización provocó que el radar calculara mal la posición del misil en unos 600 metros, lo que provocó una intercepción fallida.
Impacto:28 soldados muertos y 100 heridos
El impacto mató a 28 soldados estadounidenses e hirió a unos 100 más, lo que lo convirtió en uno de los ataques más mortíferos contra las fuerzas estadounidenses durante la guerra.
Otras fallas de software notables
Clientes de Microsoft acusados de piratería: Alguien del equipo de Windows instaló accidentalmente un software de preproducción lleno de errores en todos los servidores de Windows. Durante las siguientes 19 horas, a todos los usuarios originales de XP se les dijo que estaban ejecutando software pirateado.
Criminales en libertad condicional: En 2011, alrededor de 450 delincuentes violentos fueron liberados de la prisión del condado de California debido a un pequeño error en el código de un programa informático.
Tercera Guerra Mundial (casi sucedió):El sistema de alerta temprana nuclear de la Unión Soviética informó del lanzamiento de misiles estadounidenses el 26 de septiembre de 1983. Los sistemas soviéticos captaron por error los reflejos de la luz solar en las cimas de las nubes y los interpretaron como lanzamientos de misiles.
Más tarde, un oficial de las Fuerzas de Defensa Aérea Soviética identificó las advertencias de ataque con misiles como una falsa alarma. Esta decisión evitó una guerra nuclear y la posible muerte de millones de personas.
El apagón: La oscuridad se extendió por 8 estados de EE. UU. y afectó a 50 millones de personas en 2003. El problema era una condición de carrera causada por dos subprocesos separados de una única operación que utilizaba el mismo elemento del código.
El mapa de Apple falla: Con el lanzamiento de iOS 6, Apple decidió abandonar la plataforma superior Google Maps. Desafortunadamente, este resultó ser uno de los fracasos más épicos de la industria de la informática móvil. En septiembre de 2012, TPMIdeaLab se dio cuenta de que al software le faltaban entradas para ciudades enteras, ubicaciones ubicadas incorrectamente, imágenes satelitales oscurecidas por las nubes y más.
Vuelos de LAX en tierra: En 2007, se enviaron toneladas de datos incorrectos en la frontera de Estados Unidos y en la Red de Control Aduanero. Esto llevó al aeropuerto LAX a cerrar todo el lugar durante 8 horas; más de 17.000 aviones quedaron en tierra hasta que resolvieron el problema. El culpable fue una única pieza de software integrado defectuoso.
Leer más:
- 14 tipos diferentes de virus informáticos
- 13 tipos diferentes de malware [con ejemplos]
Tecnología Industrial
- Evite el tiempo de inactividad del generador:detección temprana con análisis de vibraciones
- Opciones de análisis
- Compare las opciones de software de CMMS para su negocio
- Cómo manejar correctamente el mecanizado de roscas en torneado CNC
- TENDENCIAS ACTUALES EN LA FABRICACIÓN
- Asegúrese de que su cadena de suministro cumpla con las nuevas leyes comerciales de EE. UU.
- Controles avanzados de orientación de herramientas en Fusion 360
- ¿Qué industrias requieren un mantenimiento periódico de los engranajes cónicos?
- Seguridad de accionamientos y máquinas
- Diagrama de circuito de fuente de alimentación dual:230 V CA a ± 12 V CC
- Montaje rápido de PCB:reducción del tiempo de comercialización para obtener una ventaja competitiva