OVH Community, your new community space.

IO Service Time y carga del servidor en general mas alta


pepejlr
23/08/2013, 14:16
El soporte de OVH se desentiende y me aclara que ningún servidor Kemsirve sea de la gama que sea no tiene sistema RAID con lo que el disco duro se haya quemado como decis me parece muy extraño. Es mas, en /etc/fstab solo me aparece una mención en /dev/sdb3 (Un disco duro secundario) pero no me aparece menciones de un disco duro secundario tanto en la partición raiz como en /home asi que ha podido ser dos cosas:

1.- Nunca he tenido ese disco secundario y yo, tonto de mi y por no revisar el servidor completamente estoy juzgando cosas que nunca ha pasado. La cosa es que hay un mdadm funcionando en RAID1 pero no hay disco de réplica asi que o me lo han instalado para hacermelo creer o es una auténtica chapuza por parte de los técnicos.
2.- Me lo han quitado en caliente y han tenido la decencia de no avisarme con unas instrucciones para desconectar el mdadm.

Por otro lado el soporte de OVH son tan majos que me lo quitaria, previo pago de 20 euros, o sea, la tarifa que te hacen cobrar para un tema de software aún siendo una cagada que ellos mismos me instalaron y por supuesto, que no vuelva a usar los tickets que todo esto al foro para abrir incidencia. Con lo cual me han dejado claro que la gama vieja de Kemsirve ya no cuenta con ventajas en torno a soporte sino que es igual que el resto. Sabiendo que ya tiene las mismas condiciones apestosas de la gama de 2013 entonces que hago pagando de más. Me paso al 4G de la nueva gama que total es lo mismo que tengo ahora pero con un tera de HDD.

Lo que está claro es que estos gráficos que colgué tienen mucha relación. Carga insólita en mi máquina y el IO por las nubes. Entre mi hermano y yo andamos mirando como deshabilitar mdadm de forma segura pero no parece fácil la cosa así que he empezado ya a hacer la copia de seguridad porque OVH pasa de mi por una cagada de ellos y me veo o esperando hasta que caduque el trimestre que pagué por mi servidor o formateando para 2 meses mi máquina.

Gracias a todos por vuestra ayuda!

Shelmak
23/08/2013, 10:12
Pues suerte, si descubres como deshacer el RAID sin peligro ponlo por aqui por favor, me interesa separar los ssd por cuestiones de espacio, si peta el ssd de backups tengo los ficheros originales, y si peta el del sistema tengo los backups.

Samael
23/08/2013, 09:50
Si está quemado esta muerto y puede no verse.
Yo en este momento estoy terminando un cambio de disco por eso digo.

Shelmak
23/08/2013, 08:02
Cita Publicado inicialmente por Samael
Yo creo lo mismo, para eso sería mejor pedir reemplazo de disco y levantas el Raid y listo.
Cierto, pero como es posible que ni siquiera detecte el HDD? Tendria que estar muuuuuy jodido el disco duro o bien se "desconecto" el latiguillo Sata, porque aunque un hdd pete debe aparecer.

Haz un smartclt a /dev/sda y prueba a hacerlo en /dev/sdb

Samael
23/08/2013, 05:23
Cita Publicado inicialmente por jack2
No será que el segundo disco murió hace algún tiempo y no lo notaste?
Yo creo lo mismo, para eso sería mejor pedir reemplazo de disco y levantas el Raid y listo.

jack2
23/08/2013, 04:31
No será que el segundo disco murió hace algún tiempo y no lo notaste?

Shelmak
22/08/2013, 23:04
Cita Publicado inicialmente por pepejlr
Acabo de mandar un ticket a OVH a ver que ostias me dicen pero vamos, no veo normal que me monten un sistema en RAID1 (Espejo) en un servidor sin un HDD de réplica. De momento ahora mi prioridad es anular ese RAID sin tener que formatear el servidor entero.
Pues si, menudo cristo te han montado, pero lo mas probable es que te hayan retirado uno de los HDD, es de suponer que no montan un sistema RAID si tienes un unico disco, seria un sinsentido, aunque visto como trabaja OVH no me extrañaria nada, a mi me metieron un kernel con Grsec cuando instale el servidor con el Plesk, y habia una incompatibilidad entre ambos que hacia loquear al plesk, asi que en cuestiones de incompetencia ya estan sobrados...

Yo siempre lo digo, si esperas que alguien medianamente competente te responda a un ticket tienes que tener mucha suerte, y si te entiende ya es un milagro porque algunos no saben ni español... suerte con lo del ticket.

pepejlr
22/08/2013, 21:33
Cita Publicado inicialmente por Shelmak
Hombre, es un RAID 1, que yo sepa se deberia poder deshacer perfectamente sin provocar daños al sistema, no se como será, pero igualmente tu estas sujeto a tu anterior contrato, y si en el momento que lo contrataste tenia dos discos no te lo pueden quitar por su cara bonita y deberian ponertelo de nuevo.
Un RAID 1 es una copia espejo, yo se desactivarlo en windows pero ni idea de como es en linux, sin embargo como te digo deberias averiguar si de verdad tu lo contrataste con dos discos, porque menuda chapuza te han hecho si es asi.
Acabo de mandar un ticket a OVH a ver que ostias me dicen pero vamos, no veo normal que me monten un sistema en RAID1 (Espejo) en un servidor sin un HDD de réplica. De momento ahora mi prioridad es anular ese RAID sin tener que formatear el servidor entero.

Shelmak
22/08/2013, 21:15
Hombre, es un RAID 1, que yo sepa se deberia poder deshacer perfectamente sin provocar daños al sistema, no se como será, pero igualmente tu estas sujeto a tu anterior contrato, y si en el momento que lo contrataste tenia dos discos no te lo pueden quitar por su cara bonita y deberian ponertelo de nuevo.
Un RAID 1 es una copia espejo, yo se desactivarlo en windows pero ni idea de como es en linux, sin embargo como te digo deberias averiguar si de verdad tu lo contrataste con dos discos, porque menuda chapuza te han hecho si es asi.

pepejlr
22/08/2013, 20:09
Prefiero saber si hay alguna manera de deshacer un RAID y usar directamente /dev/sda. Un formateo previa copia seria la última opción.

EDIT: Dispongo de un Kemsirve R-4G y venia con RAID1 instalado.

rootnovato
22/08/2013, 20:04
Cita Publicado inicialmente por pepejlr
Yo no monto estas porquerias y menos para sobrecargar la máquina. Se supone que tengo un KS-4G de la antigua gama que viene con RAID0/1 montado y dos discos duros. Tonto de mi no haber comprobado si realmente he llegado a tener dos discos duros pero el fdisk deja claro que solo tengo un disco duro y tengo un RAID fantasma montado como tu bien dices. Pobre de OVH si realmente he llegado a tener un segundo disco duro y me lo hayan quitado en caliente.

Me gustaria saber como puedo deshabilitar el mdstat y reorganizar el grub como /dev/sda en vez de como /dev/md sin miedo a crashear el sistema o a que no arranque al reiniciar. He encontrado una forma pero tengo miedo de perder los datos. Si los voy a perder si o si para hacer una copia de seguridad.

Gracias y un saludo.
Pues si debías tener dos discos reclama el que te falta. Pero yo creo que en la gama antigua los KS sólo tenían dos discos a partir del 8G. Que yo recuerde que el 4G tenía uno sólo, idéntico al del 2G.

Sino tienes derecho al segundo disco, yo que tú hacía backup de los datos y reinstalaba el sistema desde cero.

pepejlr
22/08/2013, 19:53
Cita Publicado inicialmente por rootnovato
Pues podrías empezar por quitar el RAID, porque precisamente el IO Time lo que mide son las "rascadas" del disco duro. Y si sólo tiene uno y has montado un RAID1 "fantasma" con un solo disco duro... lo raro es que no haya petado antes.
Yo no monto estas porquerias y menos para sobrecargar la máquina. Se supone que tengo un KS-4G de la antigua gama que viene con RAID0/1 montado y dos discos duros. Tonto de mi no haber comprobado si realmente he llegado a tener dos discos duros pero el fdisk deja claro que solo tengo un disco duro y tengo un RAID fantasma montado como tu bien dices. Pobre de OVH si realmente he llegado a tener un segundo disco duro y me lo hayan quitado en caliente.

Me gustaria saber como puedo deshabilitar el mdstat y reorganizar el grub como /dev/sda en vez de como /dev/md sin miedo a crashear el sistema o a que no arranque al reiniciar. He encontrado una forma pero tengo miedo de perder los datos. Si los voy a perder si o si para hacer una copia de seguridad.

Gracias y un saludo.

rootnovato
22/08/2013, 17:58
Cita Publicado inicialmente por pepejlr
Pero interpretando esto, para que coño quiero un sistema de RAID si solo tengo un disco duro. La única utilidad que tiene mdadm es que me convierte /dev/sda1 a /dev/md1 y el /dev/sda2 a /dev/md2 y no se que ventajas le veo a eso.
Pues podrías empezar por quitar el RAID, porque precisamente el IO Time lo que mide son las "rascadas" del disco duro. Y si sólo tiene uno y has montado un RAID1 "fantasma" con un solo disco duro... lo raro es que no haya petado antes.

pepejlr
22/08/2013, 17:17
Hola:

El lunes 19 por la noche le eché huevos e hice un upgrade a mi máquina a Debian 7.1 Wheezy. El proceso ha sido normal, he actualizado por pasos para mayor seguridad y solo ha estado 2 minutos reiniciandose. Los servicios que tengo en el servidor están funcionando perfectamente pero hay varios detalles significativos:

Las entradas-salidas de mi servidor desde el disco duro /dev/sda han aumentado hasta un 100% después del reinicio:
http://puu.sh/489j8.png

A su vez la carga media ha subido de forma significativa:
http://puu.sh/489rh.png
Y la carga del sistema (Gráfico verde) ha aumentado también:
http://puu.sh/489p3.png

No se si tomarlo como buena noticia pero ahora hay la mitad de procesos corriendo en la máquina:
http://puu.sh/489lm.png
pero los procesos de alta prioridad han aumentado:
http://puu.sh/489mU.png

El resto de gráficos no han experimentado cambios y como os decia, el servidor no está teniendo problemas (Salvo algunas incidencias con apache/php por alguna configuración que ando corrigiendo) pero me da bastante cosa que el sistema esté ahora más cargado, sobretodo el gráfico de IO Service Time me huele bastante mal.

He sospechado del RAID (mdadm) pero el stat es correcto (Creo yo):
http://puu.sh/489xu.png
Pero interpretando esto, para que coño quiero un sistema de RAID si solo tengo un disco duro. La única utilidad que tiene mdadm es que me convierte /dev/sda1 a /dev/md1 y el /dev/sda2 a /dev/md2 y no se que ventajas le veo a eso.

Por eso pido ayuda en el foro, a ver si alguien puede alumbrarme de que puede ser la causa. He hecho un analisis PERF RECORD, IOSTAT y monitorizo el servidor con VMSTAT y no veo nada anormal excepto lo que me escupe los gráficos de MUNIN que he ido colgando más arriba.

Un saludo.