2–4 Jun 2025
MPI für Polymerforschung
Europe/Berlin timezone

Energie-Management für einen HPC-Cluster mit Slurm

3 Jun 2025, 17:15
15m
MPI für Polymerforschung

MPI für Polymerforschung

Ackermannweg 10 55128 Mainz

Speaker

Rainer Herbst (MJBK)

Description

Die Servicegruppe IT betreibt einen kleineren HPC-Cluster und nutzt Slurm (Simple Linux Utility for Resource Management) für die Administration.

Die Auslastung des Clusters variiert. Mit Slurms "Power saving" werden Compute-Nodes automatisiert heruntergefahren und bei Bedarf wieder gestartet.

Gezeigt werden techn. Details wie die Slurm-Konfiguration und Shell-Skripts sowie Daten zum Energieverbrauch des Clusters. Weiterhin werden Hardware-Ausfallraten und Auswirkung auf die Nutzenden ausgewertet.

Primary author

Presentation materials