Extinction accidentelle des nœuds - 06/12/2016

Added by Pierre Gay almost 3 years ago

Nous avons dû redémarrer le système d'administration du cluster pour régler un problème sur le nœuds maître d'Avakas.

Ce genre d'opérations se passe d'habitude sans trop de problème, malheureusement, cette fois-ci, le système a cru à une panne du groupe froid qui pour une fois n'y était pour rien. Dès lors, le système de sécurité a automatiquement forcé l'extinction des nœuds de calcul, tuant tous les jobs qui tournaient à ce moment.

Nous redémarrons les nœuds et remettrons le cluster en production au plus tôt.

Veuillez nous excuser pour la perte de travail occasionnée.

Pierre Gay


Comments