OVH Community, your new community space.

¡¡¡Mi servidor lleva una semana OFFLINE!!


SuperViruS
18/02/2009, 20:45
Hay que reconocer lo bueno de igual manera que lo malo.

Hoy le tengo que dar un positivo al Departamento técnico de OVH España, por que a raíz de mi post anterior, ha procedido a abrir un tiket para intentar averiguar la causa de los reinicios.

Es un gesto que realmente no me esperaba y que demuestra que desde OVH España se lee el foro y se actúa.

Ahora a esperar si hay suerte y se puede encontrar el problema.

Saludetesss!!!!

Vidal OVH
18/02/2009, 09:07
Hombre, eso es capacidad de síntesis. XD

Es como decir que la revolución francesa se hizo en tres días y al final mataron al rey.

Para los amantes de los detalles, hay que decir que el RAID dió un error al sincronizar que obligó a cambiar el segundo disco duro (otra vez), luego la controladora y luego el primer disco. También se cambió la fuente de alimentación.

Al final el servidor quedó estable. Las piezas que se han cambiado se van a analizar luego por el departamento de retrofitting para averiguar cual era la que estaba defectuosa y hacer cumplir la garantía del fabricante.

El departamento de incidentes ha sido el que ha gestionado todo directamente en el datacenter a través de un tiquet de incidencia.

Un saludo y que dure...

marcianitos
17/02/2009, 21:12
Mi servidor ya está reparado y estable.
Muchas gracias

luis_sanz
17/02/2009, 19:40
admin OVH, yo llevo 3 dias esperando mi servidor, que por cierto esta pagado

darme aunq sea uno roto (que parece que de estos sobran), que necesito hacer unas pruebas urgentes para un presupuesto a un cliente.

SuperViruS
17/02/2009, 18:04
Cita Publicado inicialmente por admin OVH
Para el resto, ¿podéis darnos datos exactos de casos en los que los técnicos del datacenter evitan reparar los equipos poniendo "configuración" como motivo?
Puedes mirar las 114 intervenciones del servidor ks367832.kimsufi.com , donde desde un 1º momento el servidor se caída cada vez que usabas mas de 4 núcleos, se abrio un ticket, realizasteis un cambio de algún componente ( 2009-01-31 05:11:47 1 básica Component replacement) aunque siguió dando problemas, después de mas ticket y continuas caídas, realizáis otra intervención (2009-02-08 02:00:23 1 básica Electric connector) , a partir de ese momento aunque se podía usar ya los 8 núcleos del i7, el server se seguía cayendo... hasta que me dio por volver a formatear e instalar desde 0, pues al no poder entrar en modo vKVM, no podía llegar a ver el tipo de error que daba el Ubuntu.

No obstante, aunque el servidor se sigue reiniciando sobre una vez al día, para el uso que le doy, (Este solo lo uso para Boinc) me sirve, pero para un usuario que lo necesite para montar una web, estas caídas, (aunque solo sea una al dia) le ocasionara perdidas económicas... y llegado a este punto como se demuestra que esas caídas son debidas a un problema de hardware o de software....

En mi caso solo tengo instalado el Ubuntu Desktop, que ofrecéis en el manager y el Boinc, (este ultimo lo tengo instalado en otros servidores que tengo con vosotros, y nunca se cae el servidor) , podría ser un problema de temperaturas, o de algún modulo de memoria... pero en el modo rescue el analizador de hardware tampoco marca ningún fallo. Por lo que, es difícil especificar un motivo al abrir un ticket...

Y si se que es un Kemsirve, que somos la casta inferior de OVH, pero después que no se extrañe Oles, por que en España no alquilamos anualmente, por que en mi caso, después de esta experiencia si hubiera la opción alquilaría cada semana...

Saludetessss

Minecar
17/02/2009, 14:00
"Cuando el sabio senala la luna el necio mira el dedo". Francamente no creo que nos importe que paso con que servidor tres meses antes. Estas investigaciones os serviran de poco si no haceis un esfuerzo para mejorar y evitar estos problemas.

A mi, particularmente me importa poco que tal o cual servidor hayan tenido problemas en un momento dado si como parece, ignorais los problemas o poneis la excusa de que es un fallo de software.

Si teneis un fallo asumidlo y no echeis balones fuera.

admin OVH
17/02/2009, 12:44
Hay una diferencia entre ser "efectivo" y ser "eficiente". Matar moscas a cañonazos es efectivo, pero no es eficiente. De la misma forma, podéis seguir obrando así y devolver los servidores, es efectivo, pero no es lógico aconsejar a todo el mundo que haga lo mismo.

No hay que probar nada ni ser expertos, el técnico chequea por vosotros y cambia lo que está defectuoso. Es más, a la mínima duda, la consigna es cambiar por defecto.

Hemos ya tratado un caso de un servidor devuelto, en concreto un servidor EG que había dado problemas por una mala configuración de arranque. El mismo servidor hace 3 meses que está en posesión de un cliente polaco, tiene instalado Slackware y lo utiliza para streaming sin abrir un solo tiquet de incidente y sin tener ningún problema.

¿El hardware es diferente? No. ¿Se ha cambiado alguna pieza? No. Lo único que se ha cambiado es el uso, el sistema operativo y la configuración.

Lo reitero, enviadnos los casos, no vamos a penalizar a nadie, pero siempre es interesante revisar y (¿quién sabe?), a lo mejor encontramos algún caso lícito. No se puede descartar nada.

a-n-t-o-n-i-o
17/02/2009, 12:22
Cita Publicado inicialmente por admin OVH
Para el resto, ¿podéis darnos datos exactos de casos en los que los técnicos del datacenter evitan reparar los equipos poniendo "configuración" como motivo?

En cualquier caso, estos casos merece la pena investigarlos. Podéis enviarlos a comercial o a soporte indicando como referencia este mensaje del foro.
admin, nadie esta aunq seguro que podria aparecer alguno, no se... pero nadie esta diciendo nada de esto, simplemente comentamos lo que algunos hacemos con tal de tener a nuestros clientes lo mas online posible, yo defiendo los intereses de mis clientes y tu los intereses de OVH, no hay mas.

Yo alguna vez que tube problema me dijeron desde soporte que escribira un tiket de incidencia, que tubiera cuidado con la forma de escribir o que escribiera en ingles o frances, envie el problema y no me entendiero, volvi a enviar el problema con mas cuidado y al final lo entendieron y me lo resolvieron, no era nada critico pero tardo entre unas cosas y otras mas de 24horas, casi todo el tiempo fue intentando indicar el problema una vez lo entendieron fue rapido.

es completamente licito que si tengo un problema prefiera alquilar otro servidor y hacer un traslado, sea el problema que sea, solo tardo poco mas de 2horas y no tengo que intentar explicarme, no soy ningun experto y me cuesta demostrar que mis problemas no son de software.

si estoy obrando mal y puedo ser penalizado, decidmelo y si tal como creo es completamente licito, prefiero seguir asi.

saludos.

Vidal OVH
17/02/2009, 12:06
Para la otra persona que me ha escrito (supongo uno de vosotros o bien uno que ha leído el post), su problema es que está ursurpando MACs de otros servidores y el switch de Cisco lo bloquea.

Tienes un Windows 2003 server, así que es posible que hayas instalado un programa que te modifica la MAC o bien estás haciendo VPS mediante "Bridge". El cambio de MAC o hacer ARP con varias MAC sobre la misma tarjeta no es posible debido a la protección contra ursurpación de MAC que existe en los switches de Cisco.

Configura tus VPS para que no hagan bridge o bien revisa el software instalado para localizar el que pueda modificar la MAC de tu tarjeta de red.

Vidal OVH
17/02/2009, 11:59
Hola marcianito, he recibido tu email y he revisado con el soporte de incidentes tu servidor. Todos los fallos de hardware fueron solventados con sus respectivos tiquets (se te cambió la memoria y uno de los discos duros). El servidor quedó en línea y con SSH.

Lo que queda por hacer es una simple resincronización del RAID, una operación de administración (y por tanto que debes hacer como administrador) y para lo cual existe una guía. Es una operación sencilla puede hacerse en unos minutos.

De todos modos, he pedido a uno de los técnicos de incidentes que haga la sincronización del RAID. Normalmente una vez sincronizado el RAID todo volverá a lo normal. Ese era todo el problema.

admin OVH
17/02/2009, 10:11
Para el resto, ¿podéis darnos datos exactos de casos en los que los técnicos del datacenter evitan reparar los equipos poniendo "configuración" como motivo?

Ya se hizo una investigación hace un año estudiando caso por caso y no dio resultado. La mayoría de los casos eran debidos a una recompilación incorrecta del kernel sin los drivers / módulos del RAID, que no venían por defecto en la mayoría de kernel de Linux.

En cualquier caso, estos casos merece la pena investigarlos. Podéis enviarlos a comercial o a soporte indicando como referencia este mensaje del foro.

marcianitos
17/02/2009, 08:20
Vidal OVH, gracias.

El foro no me deja enviar mensajes de correo electrónico porque están desactivados en tu perfil. Te lo envío a: soporte [arroba] ovh.es

Un saludo

EDITO: En un archivo adjunto te envío los tickets enviados al servicio técnico a lo largo de siete días. Los errores de hardware en el servidor se han ido encadenando uno detrás de otro.

Vidal OVH
17/02/2009, 08:04
Reitero lo que he dicho en más de una ocasión : si hay un problema de hardware, se repara. Si no, es que no es un problema de hardware.

Los fallos de hardware se reparan y desde comercial se os añaden días por cada 5 horas de indisponibilidad según las normas del SLA. Lo hacemos prácticamente todas las semanas, no hay razón para abandonar servidores sin abrir siquiera un tiquet de incidencia, pero si no lo hacéis vosotros lo hará el siguiente cliente que reciba el servidor.

¿Podéis decirme un caso en el que hayáis dicho mediante un tiquet, por poner un ejemplo : "cambiadme la placa base" y no lo hayan hecho en el datacenter? La norma que tienen los técnicos es cambiar primero y preguntar después. Muchas veces se han cambiado varias piezas para luego descubrir que era un fallo de un controlador RAID, de una configuración extraña o de una aplicación saturada. Una cosa es bajar los brazos a la mínima dificultad y otra muy distinta decir que OVH tiene una política de vender máquinas defectuosas.

Pensad fríamente que dejar una máquina defectuosa no es beneficioso para nosotros. A los fallos de ping constantes irían asociados las intervenciones que tienen que hacer los técnicos, el descontento de los clientes, la mala fama asociada y por ende, los servidores serían inestables. Nos conviene aunque sea por egoísmo, reparar todas las máquinas defectuosas cuanto antes, aunque sólo sea porque cuanto más tardes en reparar una máquina, más gasto te generará después, más difícil será encontrar piezas...

¿Tendríamos tres datacenters llenos y el cuarto en vías de llenarse si esa fuera nuestra política?

Y ahora volviendo al problema de marcianitos :

No es posible que un fallo de hardware se quede sin tratar por el propio funcionamiento del sistema de monitoring.

No es posible que un servidor se quede una semana Offline, los técnicos intervienen en 1 hora al menor fallo de ping del servidor.

¿Estás seguro que el servidor tiene un fallo de hardware y no es un fallo del sistema operativo?

Si el problema se extiende más allá de una intervención, es muy posible que tengas un problema de configuración. Para más datos puedes pasarme tu servidor en privado y te diré exactamente lo que le pasa al servidor.

marcianitos
17/02/2009, 07:22
Gracias a todos por los comentarios.

Si en el día de hoy no lo tengo arreglado y sirviendo webs, mañana a primera hora tienen una queja en la Oficina del Consumidor.

a-n-t-o-n-i-o
17/02/2009, 00:43
yo opino y hago lo mismo que te recomiendan en este post

y quiza tu tengas un servidor defectuoso por culpa mia o de jriera o de MarcosBL o de Power o de cientos de usuarios que seguimos esta politica, ya que cuando nos dan un server en mal estado lo dejamos caducar y este va a parar a otro cliente que quiza lo contrata para 1 año completo y se tiene que comer el marron que otros dejaron..

lo siento, la verdad.. pero esta es la unica forma de vivir aqui y en mi opinion cuanta menos gente juegue a este juego mejor para nosotros, casi seria conveniente llevarlo en secreto imaginense que pasaria si todos actuaramos asi.. menudo caos

jriera
17/02/2009, 00:34
Ya he vivido esto, con OVH lo mejor es tener un backup constante, por eso la solución del servidor "Storage" es ideal y al mínimo problema, poder migrar a un nuevo servidor inmediatamente. Otro milagro de OVH son las IP Failover (o rangos RIPE) hacen la migración muy simple.

Es triste, penoso, ridículo, todo lo que queráis, pero así funciona está pequeña gran empresa. Además parece que se pasan las criticas (constructivas) por el forro, si no fuera por el precio poco negocio harían.

Roberman
17/02/2009, 00:29
No es necesario cambiar de server. Pide que te cambien el servidor directamente, todos los componentes. A mí me lo hicieron una vez. Pero claro, puede ser peor el remedio que la enfermedad...

MarcosBL
16/02/2009, 22:48
Te entendemos y en muchos casos lo compartimos, el consejo que te damos viene dado de la frustración: ya hemo sintentando llamar la atención sobre estas cosas sin éxito, ergo, hemos tomado ese sistema que te comentamos. Si tú quieres pelear, adelante, estás en tu derecho, pero el estar molesto (me temo) que te va a ayudar bastante poco en este tema, como ya te digo, hemos pasado por eso muchos, y (creo) seguimos aqui porque el precio sigue siendo imbatible.

marcianitos
16/02/2009, 22:39
Lo siento, no es disculpa. Yo no soy el que tiene que solucionar indirectamente el mal servicio que da esta compañía. Si tienen servidores defectuosos que los cambie, a mí qué me cuentan. Yo pago ¿no? Pues quiero el mejor servicio.

Estoy muy muy molesto con OVH, pero mucho mucho

Power
16/02/2009, 21:17
Hola,

No es de recibo que, en el espacio de un año, se hayan estropeado 3 discos duros, una cpu y la memoria ram...
Cuando ha habido tantas averías de hardware, en tan poco tiempo, es muy probable que se deba a la avería de un elemento común a todos esos componentes (probablemente fuente de alimentación).

Mi consejo es el mismo que te han dado mikelsanz y MarcosBL: cambia de máquina.

Saludos

MarcosBL
16/02/2009, 20:54
+1 mikelsanz, opino exactamente lo mismo.

mikelsanz
16/02/2009, 19:38
Un consejo básico con OVH: Dar de baja el servidor, dar de alta uno nuevo y transladar los datos. Pagar mes a mes, y al mínimo fallo, cambio de servidor. Es mi consejo. Es triste, pero es lo que recomendaría. Un saludo.

marcianitos
16/02/2009, 19:35
Este mensaje es para mostrar mi descontento con OVH.
No es de recibo, de verdad que no es de recibo que lleve una semana con el servidor caído. No es de recibo que, en el espacio de un año, se hayan estropeado 3 discos duros, una cpu y la memoria ram...

No es de recibo, no señor.
Estoy profundamente descontento con OVH. En esta última ocasión de caída del servidor, llevamos una semana offline y siempre, siempre siempre, son por fallos de hardware... Disculpen el tono soliviantado... pero... ¿con qué marca de cafeteras equipan ustedes sus servidores?

:confused::confused::confused::confused:

Espero ya una solución, espero ya una disculpa, espero ya una explicación.