OVH Community, your new community space.

Fallo eléctrico en el transformador principal número 3


admin OVH
13/06/2006, 12:44
Buenos días,

Hemos sufrido un problema en el transformador número 3 hoy, poco
después de las 11:00. Tras una intervención prevista en la parte
de media tensión del transformador, el transformador ha fallado.
Aún no conocemos la razón del fallo. Este transformador alimenta
los 3 acumuladores de las salas 4 (4.1, 4.2, 4.3, 4.4, 4.5) y la
sala 3.

El transformador número 2 no ha tomado el relevo del transformador
número 3. En la configuración normal, es el transformador número
3 quien hace de transformador de emergencia de los transformadores
número 1 y 2. Para terminar algunas mejoras eléctricas de la salas
5 y 6, hemos pasado estas salas al transformador 3 durante 2-3
semanas, hasta que todo esté terminado.

Los acumuladores han aguantado 15-30 minutos (dependiendo de cada
parte de las salas). Poco después la corriente se ha cortado,
primero en las salas 4, luego en la mitad de la sala 3 y por último
toda la sala 3, es decir, el conjunto de servidores Xeon, una parte
de los servidores de ficheros de los alojamientos compartidos y
los nuevos servidores, entregados desde comienzos de año. Hacia
las 11:40, el fallo ha alcanzado a los alojamientos compartidos
a causa de los fallos en los servidores de ficheros.

Las otras zonas del datacenter no se han visto afectadas por el
problema, ya que el transformador 1 continuó funcionando con sus
4 acumuladores.

El transformador número 3 ha sido levantado hacia las 11:50,
(un procedimiento de seguridad manipulando las llaves de baja tensión
400V y la tensión media 20.000V). El problema no ha sido el
procedimiento sino que una de las llaves se ha adherido a cerradura
y hemos tenido que forzar la cerradura para conseguir la llave y
terminar el procedimiento

Desde las 13:00 todo está de nuevo alimentado. Terminamos la puesta
en marcha de los servidores que no se han iniciado correctamente.
El fallo eléctrico ha durado alrededor de 25 minutos - entre el
momento que los primeros alimentadores se han descargado y la puesta
en marcha de la corriente de media tensión 20.000 V)


Disculpas por el incidente. Nos ha permitido constatar que, a pesar
de la formación contínua de nuestros equipos para gestionar las
alertas en el datacenter, en caso de incidente, se debe reaccionar
con sabgre fría y sobre todo saber gestionar la tasa de
adrenalina.

Amistosamente, Octave