OVH Community, your new community space.

Incidencia 3PAR Arsys y CloudBuilder


tonysanchez
10/06/2012, 23:24
Bueno conociendo la pelicula, y los multiples fallos, que tanto este como otros provedores, y que como norma general TODOS tenenkos tendencia a que nos crezca la nariz, cuando tenemos problemas nada anormal...

Lo curioso es que en el cloud no es la primera vez que pasan estas cosas.. por ahi esta la indicencia de Amazon de la que no se hablo mucho, y que dejo a cierto personaje español, friki entre los gurus, y sus "meneos" sin disponibilidad, y miles de clientes sin, sus datos, ni sin sus snapshots, que no funcionaban ninguno....

vpsdeploy
09/06/2012, 10:53
Solo com información por si alguien le interesa,
he recibido este mail de Arsys.
Un saludo.

El día de ayer, 7 de junio de 2012, sufrimos una indisponibilidad de servicio que ha afectado a
los servidores alojados en la plataforma CloudBuilder, provocando un incidente de
características excepcionales.
El problema de servicio comenzó a las 18:09h del día 7 de junio, y fue debido a un incorrecto
funcionamiento en un equipo de almacenamiento 3PAR, utilizado por la plataforma
CloudBuilder.
El origen del problema fue el fallo de una de las controladoras. Ante esta anomalía, los
mecanismos de redundancia del equipo trataron de recuperar el control del servicio en otra
controladora, que proporciona tolerancia a fallos al sistema. Como parte de este proceso de
restablecimiento del servicio, el equipo se reinició y, en la puesta en marcha, el autodiagnóstico
detectó que se encontraba en un estado técnico de "inconsistencia", con riesgo de pérdida de
datos, por lo que el equipo se apagó automáticamente. Estos sistemas están diseñados para
priorizar la salvaguarda de información y se apagan en estas situaciones.
El equipo de ingeniería de Arsys procedió al análisis del incidente y, ante la gravedad del
mismo, contactó inmediatamente con HP y 3PAR, que pusieron a trabajar a sus equipos de
ingeniería de producto en la resolución. En total, más de 60 personas en España, Estados
Unidos, Inglaterra y Holanda han estado trabajando conjuntamente para resolver la falta de
disponibilidad de CloudBuilder y han sido conscientes, en todo momento, de la criticidad del
servicio que estaban restableciendo.
A las 23:25h, el equipo de ingeniería de HP 3PAR recuperó el estado de normalidad de las
controladoras y administración del equipo de almacenamiento, si bien, para garantizar la
integridad de los datos contenidos, recomendaron realizar determinados chequeos de los
volúmenes de datos y otras comprobaciones. Una vez finalizados estos chequeos, se reinició el
sistema de almacenamiento a las 2:15h de la madrugada del día 8 de junio, comenzando a
restablecerse los servicios a partir de las 2:29h. Sólo cuando la solución nos garantizó la
integridad de los datos, procedimos a la nueva puesta en funcionamiento del sistema.
Actualmente, el fabricante y nuestro equipo técnico nos confirman que el sistema de
almacenamiento está operando con absoluta normalidad.
En Arsys, en la elección de nuestro proveedor de almacenamiento, realizamos las más
rigurosas pruebas de concepto en aspectos como robustez, escalabilidad, rendimiento y
tolerancia a fallos, que nos proporcionan las máximas garantías en la elección para nuestra
plataforma CloudBuilder. Es la primera ocasión en la que experimentamos una situación de
esta envergadura con equipamiento de este fabricante, líder mundial en soluciones de
almacenamiento Cloud y una marca de reconocido prestigio y trayectoria en el mercado IT. A
pesar de este incidente, seguimos estando firmemente convencidos de que HP 3PAR es la
mejor tecnología para nuestros servicios Cloud.
Para Arsys, la robustez y seguridad de los sistemas de nuestros clientes son nuestra razón de
ser y nuestra apuesta en este sentido es irrenunciable. Actualmente, estamos adoptando, con
el apoyo total de HP 3PAR, las medidas que nos permitan garantizar que este tipo de
incidentes no vuelvan a ocurrir, de las cuales os informaremos tan pronto como estén
totalmente definidas.
Como primera medida, aceleraremos nuestro plan de expansión de CloudBuilder a otras
ubicaciones geográficas.
Os reiteramos, sin ninguna duda, nuestro compromiso de compañía y personal en que el
servicio que prestamos desde la plataforma CloudBuilder será el que nuestros clientes
merecen.