News

Cluster Curta: Arrêt accidentel du cluster 11/01/2020 (1 comment)

Added by Pierre Gay 3 days ago

La panne du système de refroidissement (voir Arrêt accidentel du cluster 09/01/2020) s'est reproduite ce weekend. Comme cela se reproduit tous les jours, nous allons devoir arrêter la production jusqu'à ce que le fournisseur intervienne. La société APC-Schneider a été relancée par la DSI et devrait corriger le problème dans les meilleurs délais.

Nous avons redémarré les frontaux et le système GPFS afin que vous puissiez accéder à vos données, mais aucun job ne démarrera pour l'instant.

Veuillez nous excuser pour la gêne occasionnée.

Cluster Curta: Arrêt accidentel du cluster 09/01/2020

Added by Pierre Gay 10 days ago

A cause d'un problème sur le système de refroidissement de la salle SHM1 qui à provoqué une hausse importante de la température de l'air environnant de Curta, la plupart des serveurs se sont coupés automatiquement pour éviter la surchauffe.

Les jobs qui tournaient sont perdus.

Un problème similaire était intervenu en décembre et plus récemment dimanche 5 janvier.

La DSI de l'Université a contacté le fournisseur du système de refroidissement afin de régler le problème. Nous vous tiendrons informés des avancées futures.

Pour l'instant, nous ne pouvons que vous avertir que le cluster ne doit pas être considéré comme complètement opérationnel car ce problème peut se reproduire à tout instant.

Veuillez nous excuser pour les problèmes occasionnés.

Cluster Curta: Problème GPFS 07/01/2019

Added by Pierre Gay 12 days ago

Une panne du système GPFS (home et scratch) est intervenue entre 16:25 et 16:40.

Un grand nombre de nœuds ont perdu la connexion GPFS. Un grand nombre de jobs ont été interrompus.

Le problème est encore inexpliqué, mais nous allons tenter d'avoir plus d'informations.

Cluster Curta: Coupure électrique

Added by Pierre Gay 4 months ago

L'alimentation électrique de la salle machine SHM1 a été coupée ce jour entre 11h15 et 12h15.

Tous les nœuds de calcul se sont éteints. Les jobs en cours ont donc été interrompus.

Le courant est revenu, nous allons remettre les nœuds en production.

L'équipe technique

Cluster Curta: Quotas GPFS

Added by Alexandra Darrieutort 9 months ago

Les quotas GPFS vont être réactivés sur le FS_Home.

Si vous rencontrez des problèmes dans la journée, merci de faire un ticket.

L'équipe technique

Cluster Curta: Perturbations sur le GPFS (08/04/2019) (1 comment)

Added by Pierre Gay 10 months ago

En raison de nouveaux tests sur le système GPFS (voir #6108), des problèmes pourront se produire lors d'écritures sur le FS_Home dans la journée.

L'équipe technique

cluster Avakas: Mise en service du nouveau cluster Curta

Added by Pierre Gay 10 months ago

Après 7 ans de bons et loyaux services, il est temps pour Avakas de laisser la place au nouveau cluster HPC du MCIA: le puissant Cluster Curta.

Chaque utilisateur du MCIA peut d'ores et déjà se connecter sur Curta (voir la documentation en ligne).

Afin de faciliter la migration, les données du FS_home ont été synchronisées à l'avance entre les deux clusters. Nous vous prions de lire attentivement la documentation associée: Transfert des données HOME vers Curta.

Pour toute question, prière de faire un ticket.

La fermeture du cluster Avakas est prévue dans les mois qui viennent, selon le planning détaillé ici: Planning de fermeture d'Avakas

Enjoy Curta!

Cluster Curta: Ouverture du cluster Curta

Added by Pierre Gay 10 months ago

Le Cluster Curta est ouvert aux utilisateurs. Successeur du cluster Avakas, il représente une augmentation substantielle de performance.

La documentation utilisateur du cluster est consultable en ligne: Wiki.

Enjoy Curta!

cluster Avakas: Extinction accidentelle des nœuds - 06/12/2016

Added by Pierre Gay about 3 years ago

Nous avons dû redémarrer le système d'administration du cluster pour régler un problème sur le nœuds maître d'Avakas.

Ce genre d'opérations se passe d'habitude sans trop de problème, malheureusement, cette fois-ci, le système a cru à une panne du groupe froid qui pour une fois n'y était pour rien. Dès lors, le système de sécurité a automatiquement forcé l'extinction des nœuds de calcul, tuant tous les jobs qui tournaient à ce moment.

Nous redémarrons les nœuds et remettrons le cluster en production au plus tôt.

Veuillez nous excuser pour la perte de travail occasionnée.

Pierre Gay

iRODS: Formation utilisateurs Bordeaux le 26/01/2017

Added by Pierre Gay about 3 years ago

La formation aura lieu le 26/01/2017 de 14h à 16h en salle de formation du bâtiment A5 (accès http://cartographie.u-bordeaux.fr/TPG_ZoomA5.html)

Le nombre de place étant limité, veuillez vous inscrire ici: https://groupes.renater.fr/reunion/foodle/formation-MCIA-iRODS-581c6

Support de présentation: mcia-irods-tutorial-2017-01-26.pdf

1 2 3 ... 5 (1-10/50)

Also available in: Atom