Visitas : 151
En medio de la pandemia, obligados a cumplir las medidas de seguridad y ayudados por un robot. Así ha ensamblado el equipo de Nvidia uno de los superordenadores más rápidos del mundo.
Apenas cuenta con dos meses de vida y Selene ya ostenta el título del séptimo ordenador más rápido del mundo. Nvidia ha explicado cómo ha podido ensamblar esta nueva megamáquina con las complicaciones actuales.
En solo tres semanas este superordenador ya estaba en marcha. Los responsables de ensamblarlo eran un equipo de seis personas y un robot llamado Trip que tuvieron que respetar las medidas de seguridad impuestas por la pandemia mundial de la COVID-19. Nvidia explica que este tiempo de ensamblaje ha sido posible por la homogeneidad de Selene.
Este nuevo superordenador utiliza la arquitectura DGX SuperPOD acelerado por GPU que comercializa Nvidia, en vez de los diseños de encargo más pesados al que han recurrido la gran mayoría de superordenadores que forman parte de la lista Top500. Esta diferencia imponía unos plazos de construcción más largos y la dificultad de mantener y actualizar esos superordenadores.
A la hora de diseñar Selene, la idea que predominaba era la simplicidad. Cada uno de los 280 nodos de Selene es un módulo DGX estandarizado que contiene ocho GPU Nvidia A100 y dos CPU AMD Epyc. Este diseño ha permitido que simplemente fuera necesario trasladar el módulo conectarlo y comporbar que funcionara. Además, para reducir las complicaciones del cableado, Nvidia usó los conmutadores InfiniBand de Mellanox para reducir la cantidad de cables necesarios y, al mismo tiempo, aumentar el ancho de banda.
Todo esto se ha conseguido con una reducido grupo de personas y un robot. Trip se controla de forma remota y se dedica a patrullar el interior del superordenador para comprobar que todo funcione correctamente. Los miembros del equipo también han recurrido a un chat de Slack con el que reciben notificaciones si hay algún problema o se ha soltado algún cable.
Selene usa 560 CPU AMD Epyc 7742 (64 núcleos cada una) y 2240 GPU Nvidia A100. En teoría y según explica Nvidia, su rendimiento máximo es de poco menos de 35 mil teraflops. Esto la sitúa por detrás de los principales superordenadores del mundo como Summit de IBM o Fugaku en Japón y por delante de Marenostrum 4, el superordenador que IBM ha construido en Barcelona.
A la hora de diseñar Selene, la idea que predominaba era la simplicidad. Cada uno de los 280 nodos de Selene es un módulo DGX estandarizado que contiene ocho GPU Nvidia A100 y dos CPU AMD Epyc. Este diseño ha permitido que simplemente fuera necesario trasladar el módulo conectarlo y comporbar que funcionara. Además, para reducir las complicaciones del cableado, Nvidia usó los conmutadores InfiniBand de Mellanox para reducir la cantidad de cables necesarios y, al mismo tiempo, aumentar el ancho de banda.
Todo esto se ha conseguido con una reducido grupo de personas y un robot. Trip se controla de forma remota y se dedica a patrullar el interior del superordenador para comprobar que todo funcione correctamente. Los miembros del equipo también han recurrido a un chat de Slack con el que reciben notificaciones si hay algún problema o se ha soltado algún cable.
Selene usa 560 CPU AMD Epyc 7742 (64 núcleos cada una) y 2240 GPU Nvidia A100. En teoría y según explica Nvidia, su rendimiento máximo es de poco menos de 35 mil teraflops. Esto la sitúa por detrás de los principales superordenadores del mundo como Summit de IBM o Fugaku en Japón y por delante de Marenostrum 4, el superordenador que IBM ha construido en Barcelona.