We are in the process of migrating this forum. A new space will be available soon. We are sorry for the inconvenience.

OCO: OvhCheckOut


oles@ovh.net
10/03/2008, 13:00
Buenos días

Para vigilar los RPS y saber si no funcionan correctamente, si hay una partición en read-only o para saber simplemente que todo funciona bien, vamos a utilizar un sistema denominado "OVH check out" : OcO.

¿Qué es OcO? El sistema "Ovh Check Out" ha sido desarrollado inicialmente para el alojamiento compartido en OVH. Este sistema permite saber el estado del servidor de manera binaria : "OK" o "KO". Hemos añadido con el tiempo un tercer estado "OK, pero". El OcO es un sistema muy rápido y no toma apenas tiempo de ejecución ni de CPU para ejecutarse. Es un simple "cat" de ficheros.

El sistema OcO ha sido utilizado para los alojamientos compartidos de alta disponibilidad y funciona con cualquier sistema de monitoring, como Mon, Slb, etc... Para el monitoring, basta con leer los estados en el puerto 79.

# telnet 79
Trying ...
Connected to .
Escape character is '^]'.
200 OK oco-1.14h
Connection closed by foreign host.

# telnet 79
Trying ...
Connected to .
Escape character is '^]'.
350 KO oco-1.14h 300-http,300-php,300-php5
Connection closed by foreign host.

Para utilizar OcO el método es extremadamente simple y seguro. El script verifica lo que se solicita que verifique (puede ser si el servidor WEB funciona, puede ser un script de PHP de verificación de bases, puede ser una verificación de que el disco no esté dañado, puede ser lo que queráis que sea) y actualizar los estados por test.

El el puerto 79 podemos leer el estado general del servidor y las estadísticas de lo que no funciona correctamente. Si hay estados "200" en todos, es "OK"; si hay al menos un "2xx" es "OK pero". Y por último, si hay al menos un "3xx" es "KO".

Podéis personalizar los scripts de verificación: lanzáis vuestras verificaciones y si los resultados os comvienen, cread un fichero con la salida "200". Si no, cread el mismo fichero con "300". Es muy sencillo. Si el fichero no ha sido actualizado después de 5 minutos, es "300" incluso si hay un "200" en el fichero.

De momento "OcO" se podrá en funcionamiento por defecto en todas las distribuciones para el RPS, luego para todos los servidores dedicados, junto con RTM. El monitoring de OcO con alertas por email y/o SMS se propondrá en el manager junto con la monitorización de puertos (puerto 80,
22, 23, 25, 53, 3306, 110, etc), los rendimientos de una URL y el monitoring ICMP de la IP principal y las secundarias. Algunas se están ya desarrollado, pero aún no están accesibles en el Manager, otras están en camino.

El sistema OcO va a permitir crear incidentes en el seno de OVH automáticamente y completar las incidencias en curso. Si tiene un error 5xx, la incidencia se crea automáticamente y un equipo de técnicos va a gestionarla. Puede seguir sus incidencias y la resolución de manera más completa y totalmente personalizada. Las garantías SLA adicionales sobre el tiempo de atención de las incidencias también se añadirán al servicio en breve.

Respecto al RTM, permite tener datos "cifrables" del servidor: la carga de la máquina, la ocupación del disco duro, la utilización de la CPU, de la RAM, etc. En breve, tendréis la posibilidad de tener gráficas con estos datos en el manager.

Cordialmente,
Octave