Maintenance le 03/02/2012

Added by Pierre Gay over 7 years ago

Une opération de maintenance urgente concernant deux armoires du cluster (comprend les nœuds node133..node264 + bigmem04) aura lieu le 03 février dans l'après-midi.

Cette opération comprendra un redémarrage d'une partie de ces nœuds (133-196) et provoquera des interruptions du réseau (197-264 + bigmem04).

Afin de limiter au maximum l'impact sur la production, nous avons posé une réservation administrative qui permettra à vos nouveaux jobs de ne pas tomber sur cette partie pendant la période concernée. Malheureusement, les jobs qui sont déjà en train de tourner sur les machines redémarrées seront perdus, quant à ceux qui tournent sur les autres, ils pourront être perturbés par la coupure réseau.

Veuillez nous excuser pour la gêne occasionnée.

Suivi (06/02/2012): La maintenance est terminée et les nœuds ont été remis en production. Malheureusement, la plupart des jobs qui tournaient dessus ont été perdus. Encore toutes nos excuses.


Comments