Drago es un cluster de computación que consisten en 250 nodos de procesadores multi-core corriendo en el sistema operativo Rocky Linux. En esta página podrá acceder a más información sobre la configuración del sistema, hardware disponible, etc.
drago.csic.es
El sistema Drago es un Sistema de Alto Rendimiento (en inglés, HPC), a día de hoy, con dos tipo de servidores (nodos) configurados para ejecutar trabajos intensivos y paralelos. Todos los nodos ejecutan el Sistema Operativo Linux, en concreto Rocky Linux 8, clónico de RedHat Linux.
Los nodos y el sistema de almacenamiento jerárquico (en inglés, HSM) están conectados mediante una red HDR Infiniband de alta velocidad sin bloqueo, en arquitectura FAT TREE.
A continuación, se describe la configuración y características de los nodos, interconexión y sistemas de archivo.
| Nº nodos | Memoria | Procesadores | GPU | Almacenamiento local | |
| 250 | 192 GB | Dual Intel Xeon Gold 6248R 24C 3.0GHz procesors | N/A | 1 disco 240GB SSD | |
| 2 | 512 GB | Dual Intel Xeon Gold 6330 28C 3.0GHz procesors | 4 NVIDIA Ampere A100 40GB RAM | 2 discos SSD 240GB, 1 volumen discos 10TB NVMe PCI4 | |
| 22 | 2 TB | Dual Intel Xeon Platinum 8558 48C 2.1GHz procesors | N/A | 2 disco 480GB NVMe RAID 1 | |
| 8 | 2 TB | Dual Intel Xeon Platinum 8558 48C 2.1GHz procesors | 8 NVIDIA Hopper H200 141GB RAM | 2 disco 480GB NVMe RAID 1, 1 disco 4TB NVMe | |
| 2 | 2 TB | Dual Intel Xeon Platinum 8558 48C 2.1GHz procesors | 2 NVIDIA Hopper L40 48GB RAM | 2 disco 480GB NVMe RAID 1, 1 disco 4TB NVMe |
Para acceso a nodos login es necesario acceder mediante ssh al registro dns drago.csic.es:
# ssh usuario@drago.csic.es
La red de Drago para la interconexión de todos los nodos de cómputo y la red de almacenamiento está basado en Infiniband, en concreto de HDR, basada en una arquitectura FAT TREE sin bloqueo.
El sistema Jerárquico de Almacenamiento (a partir de ahora HSM) está basado en un Sistema de archivos Distribuido Paralelo implementado mediante LUSTRE (cubre 2 primeros niveles) y un tercer nivel basado en Librería Quantum SCALAR i6 con cintas LTO-8, implentado con RobinHood.
El HSM tiene 3 niveles:
Tal como se indica anteriormente, tenemos un HSM implentado en sus 2 primeros niveles mediante el Sistetma de Archivos distribuido paralelo LUSTRE, que es un sistema de archivos de código abierto.
Para la gestin de trabajos en Drago usamos SLURM
Los nodos de cómputo se agrupan en distintas particiones.
Cada partición incluye un subconjunto de nodos, con un tiempo de duración máxima y una serie de recursos específicos.
Puedes consultar el uso y la tabla de las particiones disponibles en la seccion SLURM