Mise à jour du cluster¶
Statut de la mise à jour: TERMINE
Fin mai 2024, le cluster a été complètement réinstallé sous l'environnement Rocky Linux 8.6.
Du 2 au 5 septembre, les serveurs GPFS ont été mis à jour.
Connexion¶
À la connexion, vous pouvez avoir ce message qui s'affiche:
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ @ WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! @ @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY! Someone could be eavesdropping on you right now (man-in-the-middle attack)! It is also possible that a host key has just been changed. The fingerprint for the ECDSA key sent by the remote host is SHA256:lWVVIfxx1a/SzSnSSjsTfjqgNm8hx2IMCj11kmqZMZA. Please contact your system administrator. Add correct host key in /home/<username>/.ssh/known_hosts to get rid of this message. Offending ECDSA key in /home/<username>/.ssh/known_hosts:352 remove with: ssh-keygen -f "/home/<username>/.ssh/known_hosts" -R "curta.mcia.fr" Host key for curta.mcia.fr has changed and you have requested strict checking. Host key verification failed.Veuillez vérifier que l'empreinte affiché dans le message correspond bien à l'une des empreintes des clés publiques de Curta ci-dessous avant d'accepter la connexion:
Algorithme | Clé |
---|---|
RSA | SHA256:mOP0eii011omSVZw4Hb4l72T/kMaCsYwEQY8cP+guo8 |
ECDSA | SHA256:lWVVIfxx1a/SzSnSSjsTfjqgNm8hx2IMCj11kmqZMZA |
DSA | SHA256:+f5WPtIdt00UMwG6pC4YuHRiV8pBhmNlVCkZHYO4/JM |
ED25519 | SHA256:oIJKd1MCql10jkYcq95Qg2DOengmiUwjsBj8EcQ4kds |
Les éléments à prendre en compte:¶
- Ceux qui avait soumis des jobs sur la plateforme de test (depuis curta2.mcia.fr) devront les re-soumettre.
- Les modules spack ont été recompilés sur l'environnement Rocky 8 ce qui a modifié le nom des modules donc vérifiez bien le nom des modules dans vos jobs.
- La compilation avec les modules intel 2018, 2019 et 2020 ne fonctionne plus car le format de la licence Intel n'est plus valide dans la dernière version du serveur de licence FlexLM. L'alternative est d'utiliser les dernière version d'Intel OneAPI (disponibles en module et module spack).
- La baisse de fréquence CPU a été supprimé en faveur de la fonctionnalité (disponible dans les dernières version de slurm): le power saving.
Lorsqu'un noeud reste dans un état idle pendant 1h, slurm ordonnera son extinction jusqu'à ce qu'il y ait des demandes de ressources.
Si l'état de votre job est en CONFIGURING (CF) cela signifie que slurm a demandé le redémarrage des noeuds pour y soumettre votre job.
- Les nœuds de calcul sont maintenant configurés avec les processeurs en mode Turbo, ce qui pourra occasionner des différences en termes de performances des calculs, mais aussi devrait permettre d'optimiser la consommation des nœuds selon la charge de travail.
N'hésitez-pas à nous faire part des problèmes rencontrés en faisant des tickets.
Les problèmes courants¶
- Votre programme réclame une librairie avec un numéro spécifique (
libgfortran.so.3
,libtk8.5.so.x
, ...) qui est manquante
-> essayez de charger le moduleoldlibs/c7/compute