Manufactura industrial
Internet industrial de las cosas | Materiales industriales | Mantenimiento y reparación de equipos | Programación industrial |
home  MfgRobots >> Manufactura industrial >  >> Industrial Internet of Things >> Incrustado

Xilinx duplica Alveo HBM, agrega clústeres para cargas de trabajo de HPC y big data

En la conferencia de supercomputación SC21 de esta semana, Xilinx presentó su tarjeta aceleradora de centro de datos Alveo U55C y una nueva solución de agrupación en clúster basada en estándares e impulsada por API para implementar FPGA a escala masiva. La compañía dijo que al permitir la agrupación en clústeres de cientos de tarjetas Alveo y la capacidad de programación de alto nivel tanto de la aplicación como del clúster, esta nueva tarjeta hace que escalar las capacidades de cómputo de Alveo para apuntar a cargas de trabajo de computación de alto rendimiento (HPC) sea más fácil y más eficiente que antes.

Xilinx dijo que la tarjeta Alveo U55C está diseñada específicamente para cargas de trabajo de HPC y big data, y ofrece la mayor densidad de cómputo y capacidad HBM (memoria de alto ancho de banda) en la cartera de aceleradores Alveo. Junto con la nueva solución de agrupación en clúster basada en Xilinx RoCE v2, un amplio espectro de clientes con cargas de trabajo informáticas a gran escala ahora pueden implementar una potente agrupación en clúster HPC basada en FPGA utilizando su infraestructura y red de centro de datos existente. Desde el punto de vista arquitectónico, el acelerador basado en FPGA afirma proporcionar el mayor rendimiento al menor costo para muchas cargas de trabajo de procesamiento intensivo. Está introduciendo una metodología basada en estándares que permite la creación de clústeres Alveo HPC utilizando la infraestructura y la red existentes del cliente.

La compañía dijo que este es un gran paso adelante para una adopción más amplia de Alveo y la computación adaptativa en todo el centro de datos.

En una entrevista con embedded.com, Nathan Chang, gerente de productos de HPC para centros de datos en Xilinx, dijo:"Estamos empezando a ver que la computación no siempre es el cuello de botella. En realidad, la mayoría de las veces tiende a ser el ancho de banda de la memoria. Cada vez hay más problemas de computación que se limitan al ancho de banda de la memoria. Entonces, reducimos nuestra tarjeta a una sola ranura y también duplicamos el HBM en esa tarjeta. Pero lo que es más importante, proporcionamos la capacidad de escalar horizontalmente a través de estas tarjetas, con la capacidad de crear grandes grupos con cientos de tarjetas y apuntar a todo el HBM en esas tarjetas ".

Continuó:“Desbloquear el ancho de banda en los grupos de tarjetas Alveo siempre ha sido un gran esfuerzo para nuestra comunidad. Los desarrolladores tuvieron que crear equipos y luego crear sus propios diseños de agrupamiento para satisfacer sus necesidades. Ahora estamos avanzando con un paquete de agrupación en clúster basado en estándares abiertos, lo que significa que aprovecharemos RoCE v2 y el puente del centro de datos, en todo Ethernet con un ancho de banda de 200 Gbps en cada tarjeta ”.

"Esto significa que en la infraestructura existente en los centros de datos, podrá colocar estas tarjetas en los servidores existentes, aprovecharlas en las redes Ethernet existentes y competir con InfiniBand en rendimiento y latencia".

“Otro punto clave es que no solo estamos creando espacio para mayores cargas de trabajo, sino que también nos aseguramos de que Vitis sea más accesible para la comunidad de desarrolladores. Ya no es necesario que entienda RTL o Verilog. Puede programar tarjetas Alveo y apuntar a tableros Alveo con lenguajes de alto nivel existentes como C, C ++ y Python ”.

Funciones de Alveo U55C para HPC y big data

La tarjeta Alveo U55C combina muchas características clave que requieren las cargas de trabajo HPC actuales. Ofrece más paralelismo de canalizaciones de datos, gestión de memoria superior, movimiento de datos optimizado en toda la canalización y el rendimiento por vatio más alto de la cartera de Alveo, según Xilinx. La tarjeta tiene un factor de forma de una sola ranura de altura completa y media longitud (FHHL) con una potencia máxima baja de 150W. Ofrece una densidad de cálculo superior y duplica el HBM2 a 16 GB en comparación con su predecesora, la tarjeta Alveo U280 de doble ranura. Por lo tanto, el nuevo U55C proporciona más computación en un factor de forma más pequeño para crear densos clústeres basados ​​en aceleradores Alveo. Esto tiene como objetivo la transmisión de datos de alta densidad, las matemáticas de IO elevadas y los grandes problemas de computación que requieren escalabilidad horizontal, como el análisis de big data y las aplicaciones de inteligencia artificial.

Aprovechando RoCE v2 y el puenteo del centro de datos, junto con un ancho de banda de 200 Gbps, la solución de agrupación basada en API permite una red Alveo que compite con las redes InfiniBand en rendimiento y latencia, sin bloqueo de proveedores. La integración de MPI permite a los desarrolladores de HPC escalar horizontalmente la canalización de datos de Alveo desde la plataforma de software unificada Xilinx Vitis. Utilizando marcos y estándares abiertos existentes, la compañía dijo que ahora es posible escalar horizontalmente a través de cientos de tarjetas Alveo independientemente de las plataformas de servidor y la infraestructura de red y con cargas de trabajo y memoria compartidas.

Los desarrolladores de software y los científicos de datos pueden obtener los beneficios de Alveo y la computación adaptativa a través de la programabilidad de alto nivel tanto de la aplicación como del clúster utilizando la plataforma Vitis. Xilinx dijo que ha invertido mucho en la plataforma de desarrollo de Vitis y el flujo de herramientas para hacer que la computación adaptativa sea más accesible para los desarrolladores de software y científicos de datos sin experiencia en hardware. Se admiten los principales marcos de inteligencia artificial como Pytorch y Tensorflow, así como lenguajes de programación de alto nivel como C, C ++ y Python, lo que permite a los desarrolladores crear soluciones de dominio utilizando API y bibliotecas específicas, o utilizar kits de desarrollo de software Xilinx, para acelerar fácilmente la HPC clave. cargas de trabajo dentro de un centro de datos existente.

¿Quién usa las tarjetas?

Chang dijo que la compañía ha estado trabajando con varias organizaciones en diseños de prueba de concepto utilizando las tarjetas U55C.

Uno de ellos es CSIRO, la organización de investigación nacional de Australia junto con el conjunto de antenas de radioastronomía más grande del mundo, que utilizó el U55C en lugar de las GPU, porque la tarjeta Alveo permite la tarjeta de una sola ranura y no requiere una NIC (tarjeta de interfaz de red). CSIRO está utilizando tarjetas Alveo U55C para el procesamiento de señales en el radiotelescopio de kilómetros cuadrados. La implementación de las tarjetas Alveo como aceleradores conectados a la red con HBM permite un rendimiento masivo a escala en todo el grupo de procesamiento de señales HPC. El clúster basado en aceleradores Alveo permite a CSIRO abordar la enorme tarea de cálculo de agregar, filtrar, preparar y procesar datos de 131.000 antenas en tiempo real. Los 460 Gbps de ancho de banda HBM2 en todo el clúster de procesamiento de señales son atendidos por 420 tarjetas Alveo U55C completamente conectadas en red a través de conmutadores de 100 Gbps habilitados para P4. El clúster Alveo U55C ofrece un rendimiento de procesamiento con un rendimiento general de 15 TB / s en un tamaño compacto y rentable. CSIRO ahora está completando un ejemplo de diseño de referencia de Alveo para ayudar a otras industrias de radioastronomía o adyacentes a lograr el mismo éxito.

Otro ejemplo de caso de uso es con el software de simulación de accidentes Ansys LS-DYNA, que es utilizado por casi todas las empresas automotrices del mundo. El diseño de sistemas estructurales y de seguridad depende del rendimiento de los modelos, ya que mitigan los costos de las pruebas de choque físicas con simulaciones del método de elementos finitos (FEM) de diseño asistido por computadora. Los solucionadores FEM son los algoritmos principales que impulsan las simulaciones con cientos de millones de grados de libertad, estos enormes algoritmos se pueden dividir en solucionadores más rudimentarios como PCG, matrices dispersas, ICCG. Al escalar a lo largo de muchas tarjetas Alveo con canalización de datos hiper paralelo, LS-DYNA puede acelerar el rendimiento en más de 5 veces en comparación con las CPU x86. Esto da como resultado más trabajo por ciclo de reloj en una tubería de Alveo y los clientes de LS-DYNA se benefician de los tiempos de simulación que cambian las reglas del juego. “Con el espíritu de la innovación implacable, estamos entusiasmados de colaborar con Xilinx para acelerar significativamente los solucionadores de elementos finitos, que pueden representar el 90% de la carga de trabajo de cómputo para la mecánica implícita, en nuestra aplicación de simulación LS-DYNA”, dijo Wim Slagter. , director de asociaciones estratégicas de Ansys. "Esperamos que la aceleración de Xilinx nos ayude en nuestra misión de apoyar a los innovadores en la ingeniería del futuro".

Xilinx citó un tercer ejemplo, el de TigerGraph, un proveedor de una plataforma líder de análisis de gráficos. La compañía está utilizando varias tarjetas Alveo U55C para agrupar y acelerar los dos algoritmos más prolíficos que impulsan los motores de agrupación y recomendación basados ​​en gráficos. Las bases de datos gráficas son una plataforma disruptiva para los científicos de datos. Los gráficos toman datos de los silos y enfocan las relaciones entre los datos. La próxima frontera para el gráfico es encontrar esas respuestas en tiempo real. Alveo U55C acelera los tiempos de consulta y las predicciones para los motores de recomendación de minutos a milisegundos. Al utilizar varias tarjetas U55C para ampliar los análisis, la potencia computacional superior y el ancho de banda de la memoria acelera las velocidades de consulta de gráficos hasta 45 veces más rápido en comparación con los clústeres basados ​​en CPU. La calidad de las puntuaciones también aumenta hasta en un 35 por ciento, lo que da como resultado una mayor confianza que reduce drásticamente los falsos positivos a un solo dígito.

La tarjeta Alveo U55C está disponible actualmente en el sitio web de Xilinx y a través de los distribuidores autorizados de Xilinx. También está disponible para evaluación a través de proveedores de FPGA como servicio basados ​​en la nube pública, así como también en centros de datos de colocación seleccionados para vistas previas privadas. La agrupación en clústeres está disponible ahora para vistas previas privadas, y se espera una disponibilidad general en el segundo trimestre del próximo año.


Incrustado

  1. Siemens agrega a Veloce para una verificación asistida por hardware sin problemas
  2. Convertir macrodatos en datos inteligentes con IA incorporada
  3. TI:La tecnología de resonador BAW allana el camino para las comunicaciones de próxima generación
  4. DATA MODUL:nueva tecnología de unión para proyectos de gran volumen
  5. Cervoz:SSD resistente de grado militar para aplicaciones de misión crítica
  6. CEVA:procesador de inteligencia artificial de segunda generación para cargas de trabajo de redes neuronales profundas
  7. Kontron:nuevo estándar informático integrado COM HPC
  8. acceed:módulos de E / S para comunicación de datos escalable
  9. Cuatro grandes desafíos para la Internet industrial de las cosas
  10. ¿Los macrodatos proporcionarán una panacea para los presupuestos sanitarios en crisis?
  11. Big Data vs Inteligencia Artificial