OVH Community, your new community space.

RAID soft -vs- hard en servers OVH (proxmox)


apocalipsis
03/10/2013, 16:32
La mejor opcion: snapshots cada media hora (ojo, con rotacion), rsync cada 2 horas y backup diario. En un equipo con 2 discos es lo mas parecido a un raid, sin los problemas que el raid conlleva.

xenomm
03/10/2013, 12:18
100% correcto TODO lo que dice tonysanchez, hacedle caso que lleva mas razon que un santo
En proxmox mas vale tener un disco para hacer copias de seguridad muy frecuentes que tenedlo en raidsoft. como haya que recomponer raid por cualquier razon, apañaos vais.

tonysanchez
30/09/2013, 16:35
A la pregunta original...

Proxmox no aconseja y es mas "desaconseja" raid software.
Los motivos evidentes, aunque algun experto de aqui, diga que prefiere raid por software a raid por hardware (siempre que sea con bateria... of course)

en mi experiencia personal, me he cargado mas de 20 discos duros en OVH con raid por software, y solo lo uso para equipos que tengo en hetzner para backups, con 12 o 24TB.

No te quiero decir cuando se rompe un discos lo GRACIOSO que es recomponerlo. Y en Proxmox, olvidate, pues como no pares las maquinas virtuales vas de culo, en tiempo y en rendimiento.

No se me ocurriria ni harto sopa, un raid soft en modelos de produccion con Web y/o MysQL con virtualizacion (ni sin virtualizacion)
...

Saludos.

PacoSS
28/09/2013, 21:31
+99 Kilburn

luismi777
28/09/2013, 20:57
Muchas gracias a todos. Ha sido un post muy instructivo y he aprendido mucho

Kilburn
27/09/2013, 15:57
Creo que sería interesante aclarar algunos conceptos, puesto que no estoy seguro que todos comprendamos bien este tema del raid soft/hard y las diferentes alternativas.

Según tengo yo entendido, a grandes rasgos hay 4 tipos diferentes de RAID (a nivel soft/hard, no a nivel de configuraciones del RAID en sí):

1. Software RAID
El que monta OVH en los servidores "de gama baja". En este caso, es el sistema operativo quien implementa toda la lógica del sistema RAID. Los cálculos se realizan en la CPU, y la lógica está implementada en el kernel (sistemas unix-like).

Ventajas
  • Al estar implementado en kernel (open source), la lógica de control está ampliamente probada y es muy difícil que contenga errores que destruyan el sistema RAID
  • Como no se necesita ninguna controladora especial, la información de los discos se puede recuperar (o se puede reconstruir el RAID) en cualquier pc normal, sin necesidad de disponer de una controladora igual como repuesto


Inconvenientes
  • La lógica de gestión corre en la CPU, por lo que se utiliza capacidad de procesado de la máquina, disminuyendo su rendimiento (en CPU mayormente)
  • Como no hay cachés persistentes de por medio, cuando un programa pide confirmación de que los datos se han escrito al disco, hay que esperar a que el disco escriba. Esto es problemático especialmente con discos rotativos, puesto que son lentos realizando pequeñas escrituras.


Conclusión: Una buena opción para montar RAIDs de forma barata. Fácil de gestionar, pocas posibilidades de fallo, fácil de rescatar datos si algo falla.

En OVH: Podéis montarlo en cualquier server que tenga 2 discos o más. Única opción para las gamas bajas y algunos de los híbridos.

2. "Hardware" RAID (en placa)
Otra opción típica es el "hardware" RAID que integran las placas de informática de consumo. En este caso, el fabricante anuncia que soporta "hardware raid" pero es una mentira como una catedral. En realidad, la placa lleva un chip que puede hacer algunas cosillas, pero la mayoría de la lógica está implementada en el driver que te obligan a instalar para que eso funcione. Es decir, al final es prácticamente un software raid, pero con implementación propietaria en vez de la del kernel.

Ventajas
  • Una pequeña parte de la lógica corre en un chip especial. No es mucho tampoco.


Inconvenientes
  • La mayoría de la lógica de gestión corre en la CPU (a través del driver), por lo que se utiliza capacidad de procesado de la máquina, disminuyendo su rendimiento (en CPU mayormente)
  • Como no hay cachés persistentes de por medio, cuando un programa pide confirmación de que los datos se han escrito al disco, hay que esperar a que el disco escriba. Esto es problemático especialmente con discos rotativos, puesto que son lentos realizando pequeñas escrituras.
  • La lógica de gestión es una implementación propietaria, mucho menos probada que la de los kernels *nix o las controladoras especializadas. Es mucho más probable que contenga fallos y te destruya los datos por accidente.
  • Como se necesita una controladora igual para leer los discos, la información no se puede recuperar en cualquier pc normal, siendo necesario disponer de una controladora (placa base) igual como repuesto por si peta la original.


Conclusión: Nunca uséis este tipo de RAID. Mejor usar RAID software.

En OVH: No disponible que yo sepa.

3. Hardware RAID (tarjeta especializada)
Primera opción de RAID hardware de verdad. Desarrolladas por empresas especializadas, incluyen un procesador que se encarga completamente de la gestión del raid (sin que la CPU tenga que cargar con eso) y suelen incluir memoria caché (de modo que no hace falta usar memoria del sistema para ese fin, o por lo menos no tanta).

Ventajas
  • La lógica corre en el chip de la tarjeta. Prácticamente no hay "overhead" para la CPU
  • Aunque la lógica es propietaria, las empresas se dedican a eso. Es decir, se juegan su reputación y futuro así que son muy cuidadosos en implementar con la máxima eficiencia y fiabilidad. No suelen dar problemas en estos aspectos, e incluso en casos superan la eficiencia de las implementaciones software (*nix)


Inconvenientes
  • Como no hay cachés persistentes de por medio, cuando un programa pide confirmación de que los datos se han escrito al disco, hay que esperar a que el disco escriba. Esto es problemático especialmente con discos rotativos, puesto que son lentos realizando pequeñas escrituras.
  • Como se necesita una controladora igual para leer los discos, la información no se puede recuperar en cualquier pc normal, siendo necesario disponer de una controladora (placa base) igual como repuesto por si peta la original.


Conclusión: Este tipo de hardware raid empieza a ser interesante, sobretodo para montar RAIDs de muchos discos, donde el "overhead" de gestión sería notable si usáramos una implementación RAID software. Si necesitas ese poquito más de CPU/memoria en tu server, te puede salvar del apuro. Así en general, yo creo que no merece la pena liarse.

En OVH: Disponible en gamas antiguas de EG y MG, así como en los mHG actuales.

4. Hardware RAID (tarjeta especializada) + Batería/Caché persistente
El RAID hardware que cambia las cosas. Básicamente, se trata de lo mismo que lo anterior, con una pequeña diferencia: se incluye una batería (o una memoria no volátil) para proteger la caché de la controladora ante cortes de electricidad.

Ventajas
  • La lógica corre en el chip de la tarjeta. Prácticamente no hay "overhead" para la CPU
  • Aunque la lógica es propietaria, las empresas se dedican a eso. Es decir, se juegan su reputación y futuro así que son muy cuidadosos en implementar con la máxima eficiencia y fiabilidad. No suelen dar problemas en estos aspectos, e incluso en casos superan la eficiencia de las implementaciones software (*nix)
  • Lo más importante: la caché es ahora "persistente" (no se borra si se corta la electricidad). Eso permite a la tarjeta confirmar las escrituras aunque no estén en los discos todavía (porque los datos ya no se pueden perder una vez están en la memoria caché). Así se elimina en gran medida el problema de los discos rotativos (la latencia). Además ahora la targeta tiene más margen para "reordenar" las peticiones de escritura según convenga para los discos, mejorando en mucho el rendimiento de los mismos.


Inconvenientes
  • Como se necesita una controladora igual para leer los discos, la información no se puede recuperar en cualquier pc normal, siendo necesario disponer de una controladora (placa base) igual como repuesto por si peta la original.
  • Una tarjeta decente con batería cuesta unos 700€. Ouch.


Conclusión: Si tienes el dinero y necesitas rendimiento I/O, ésta es tu solución. Si la controladora es buena, añade algún disco SSD y el rendimiento ya será espectacular

En OVH: Disponible en SP-BestOf, EG 64G-R y superiores.


Ale, espero que esta mini-guía ayude a alguien. Si tenéis sugerencias o correcciones o lo que sea decidlo!

apocalipsis
27/09/2013, 15:47
Cita Publicado inicialmente por manoleet
Más que mucha memoria, no menos de 8GB, necesitarás que sea ECC!

No creas, en el caso de ZFS al estar incorporada la gestion de crc en el propios sistema de ficheros, asi como la autoreparacion, la memoria ECC no es tan importante.

manoleet
27/09/2013, 11:54
Cita Publicado inicialmente por apocalipsis
Y un sistema de ficheros que no sea de juguete (ZFS) y prefiero el raid soft al hard raid con diferencia.

P.D: eso si... necesitarás mucha memoria
Más que mucha memoria, no menos de 8GB, necesitarás que sea ECC!

suicidal
27/09/2013, 11:34
Cita Publicado inicialmente por apocalipsis
Como todo depende... a mi dame un procesador con soporte nativo sas y raid

https://communities.intel.com/commun...eneration-raid


Y un sistema de ficheros que no sea de juguete (ZFS) y prefiero el raid soft al hard raid con diferencia.

P.D: eso si... necesitarás mucha memoria
Y mucha pasta, estoy seguro que el precio de la tarjeta te lo van a cobrar en el procesador xD

Vaya monstruosidad, madre mía. Es asombroso la velocidad a la que evoluciona todo...

apocalipsis
27/09/2013, 11:18
Como todo depende... a mi dame un procesador con soporte nativo sas y raid

https://communities.intel.com/commun...eneration-raid


Y un sistema de ficheros que no sea de juguete (ZFS) y prefiero el raid soft al hard raid con diferencia.

P.D: eso si... necesitarás mucha memoria

PacoSS
26/09/2013, 23:53
Cita Publicado inicialmente por luismi777
mount
...
/dev/md2 on / type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=0,data=ordered)
...
/dev/mapper/pve-data on /var/lib/vz type ext3 (rw,relatime,errors=continue,user_xattr,acl,barrie r=0,data=ordered)
...

cat /proc/mdstat
Personalities : [raid1]
md4 : active raid1 sda4[0] sdb4[1]
1931981760 blocks [2/2] [UU]

md2 : active raid1 sda2[0] sdb2[1]
20478912 blocks [2/2] [UU]
Que el raiz está en raid 1 es evidente, está en md2.

Y por el numero de bloques del otro raid 1, el md4, debe de contener el resto del disco con el volumen del LVM2.

El raid software no corre mas que un raid hardware medio decente.
Y si la controladora es buena y con cache (las de ovh llevan 1 gb) el servidor soportará una mayor concurrencia de operaciones.

Simplemente cambia en tu mente la controladora de disco por ejemplo por la tarjeta gráfica. Si descargas la CPU de operaciones, aumentará su capacidad de proceso.
No la velocidad punta, el test sintético a equipo vacío será igual (a lo sumo) en el raid software, pero al meterle miles de peticiones de operaciones por segundo de un entorno multiusuario/multiproceso, va a responder mucho mejor sin duda alguna, tiene menos faena.

Un saludo.

luismi777
26/09/2013, 08:18
Gracias por la ayuda.

mount
sysfs on /sys type sysfs (rw,nosuid,nodev,noexec,relatime)
proc on /proc type proc (rw,nosuid,nodev,noexec,relatime)
udev on /dev type devtmpfs (rw,relatime,size=10240k,nr_inodes=4104116,mode=75 5)
devpts on /dev/pts type devpts (rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode =000)
tmpfs on /run type tmpfs (rw,nosuid,noexec,relatime,size=3285280k,mode=755)
/dev/md2 on / type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=0,data=ordered)
tmpfs on /run/lock type tmpfs (rw,nosuid,nodev,noexec,relatime,size=5120k)
tmpfs on /run/shm type tmpfs (rw,nosuid,nodev,noexec,relatime,size=6989560k)
/dev/mapper/pve-data on /var/lib/vz type ext3 (rw,relatime,errors=continue,user_xattr,acl,barrie r=0,data=ordered)
rpc_pipefs on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw,relatime)
fusectl on /sys/fs/fuse/connections type fusectl (rw,relatime)
beancounter on /proc/vz/beancounter type cgroup (rw,relatime,blkio,name=beancounter)
container on /proc/vz/container type cgroup (rw,relatime,freezer,devices,name=container)
fairsched on /proc/vz/fairsched type cgroup (rw,relatime,cpuacct,cpu,cpuset,name=fairsched)
/dev/fuse on /etc/pve type fuse (rw,nosuid,nodev,relatime,user_id=0,group_id=0,def ault_permissions,allow_other)

Esto me llama mucho la atención, ya que parece que no están usados los mismos bloques de los dos discos:

cat /proc/mdstat
Personalities : [raid1]
md4 : active raid1 sda4[0] sdb4[1]
1931981760 blocks [2/2] [UU]

md2 : active raid1 sda2[0] sdb2[1]
20478912 blocks [2/2] [UU]

PacoSS
26/09/2013, 01:18
El raid soft está total y absolutamente desaconsejado por la gente de Proxmox.

Solo raid hard.

Yo nunca he tenido un problema, ya he tenido raid 0 (no espejo) por LVM, no por el mdadm por defecto de linux, pero son innumberables los testimonios de gente que habra de 21 dias recomponiendo el raid soft en proxmox en background.

Si pegas aqui un mount, veremos si el raid está en raid o no.

apocalipsis
25/09/2013, 22:12
http://t2752.codeinpro.us/q/5080d4fe4f1eba38a49bf130

luismi777
25/09/2013, 16:00
Buenas chicos,

Tengo una duda sobre como funcionan los RAID en Proxmox.

Tengo contratado con OVH un mSP con Proxmox. Dejé el particionamiento por defecto con Raid soft. Veo que los datos Proxmox (/vz) están en un raid soft de tipo Linux, pero no estoy seguro sobre el propio Linux que compone el Proxmox. Creo que en este caso no está en Raid, sino que está en uno de los discos duros. ¿Alguien podrían confirmarme si esto es así? Imagino que de ser así, el riesgo es que se estropee el disco donde está el Proxmox, ya que en ese caso, aunque OVH cambiase el disco roto, no se recuperaría el sistema.

Por otra parte, tenía pensado cambiarlo por un SP BestOf, que tienen tarjeta Raid Hard. En este caso imagino que si se rompe cualquiera de los dos discos duros, valdría con cambiarlo y no habría pérdida ni de servicio ni de datos, ¿no? Según he leído en algún sitio, el rendimiento es muchísimo mejor que con el Raid Soft. ¿Alguien tiene más experiencia con este tema?