OVH Community, your new community space.

Problema con el boot en dedicado.


MarcosBL
28/10/2008, 23:17
Como update, por si a alguien le vuelve a psar lo que a mi, al final contraté maquina nueva y no vi un duro. En la nueva, todo perfecto.

Este lunes contraté otra más, y con el sistema recien instalado, sin tocar ABSOLUTAMENTE NADA hice el update-world, reinicié y... adivinad ? tarjeta de red que NO levanta. Formateo, paso 3 kilos de hacer update de la maquina, instalo todos los servicios... los pruebo, reinicio, reinicio con netboot, reinicio de nuevo... todo perfecto. Misterios nos trae el señor, oiga.

jaiak
28/10/2008, 19:55
MarcosBL, me identifico totalmente contigo.

El sábado al medio día fallaron los discos NFS de muchos de los RPS1, mi RPS ya no ha vuelto a arrancar. Llevo desde el sábado con falsas esperanzas, no me arranca en modo KVM y en modo rescue no logro solucionar nada.

Contraté hace unas 30 horas un RPS3 para migrar los datos mientras solucionaba la avería del RPS1 (iluso de mi) y me dicen que hasta dentro de unos días no me lo activarán porque están teniendo problemas con los NFS... :S

Resumen, me largo... hostalia por ejemplo. No lo sé.

Saludos

MarcosBL
05/06/2008, 12:39
Gracias Josu, icenrg, aicom, claro que sirve, al menos para tomar perspectiva, de que no es un problema de algo que yo haya hecho mal, sino que los demás lo ven como yo.

Acabo de hablar de nuevo con soporte y me han remitido a comercial@ovh.es para que ponga una reclamación, esa es toda la solución que se me da... asi que ya llegados a ese extremo, acabo de registrar ante notario todos los emails cruzados, pantallazos de las incidencias en el manager, un email a comercial@ovh.es con copia a oles@ovh.net solicitando el cambio del servidor por uno completamente nuevo y el reembolso del importe de los meses futuros prepagados, tambien registrado dicho email ante notario.

Mira que es triste tener que rebajarse a estos gastos, estas molestias y estas bajezas... pero es que ya no me quedan más puertas que tocar. Os contaré la respuesta de comercial, veremos a ver que pasa, al menos sabremos todos si al final se puede confiar en la oferta de garantia de sustitución hardware de OVH o voy a tener que comerme todas las alabanzas que les he hecho en este año y darle la razón a la manada de trolls que pululan por aqui.

aicom
05/06/2008, 12:33
Cita Publicado inicialmente por icenrg
Hola Marcos.

Lo dicho por Josu, yo ya no me fiaría de esa maquina, ya puestos a reinstalar todo y si pagas por meses yo me pillaría otro servidor pq ese ya no sabes cuando va a volver a fallar. Aunque en este caso lo justo seria que ovh se hiciera cargo del cambio de maquina.

Tienes el apoyo moral de todos (aunque ya se que eso de poco sirve).
Tirón de orejas al soporte de OVH,

Marcos seria buena idea que enviaras un mail a oles@ovh.net y le explicaras tu caso, creo haber leido que la semana pasada o esta (ya no lo recuerdo) venia de "visita" a ver a la gente de ovh-españa y en ese post se le mostro las quejas respecto al escaso soporte que tenemos, el tema lo tendra aun calentito, aprovecha que con un poco de suerte se mueven los hilos necesarios para solventarte este problema.

Saludos.

icenrg
05/06/2008, 11:26
Hola Marcos.

Lo dicho por Josu, yo ya no me fiaría de esa maquina, ya puestos a reinstalar todo y si pagas por meses yo me pillaría otro servidor pq ese ya no sabes cuando va a volver a fallar. Aunque en este caso lo justo seria que ovh se hiciera cargo del cambio de maquina.

Tienes el apoyo moral de todos (aunque ya se que eso de poco sirve).

MarcosBL
05/06/2008, 11:15
Ahora si que he "tocado fondo", después de reinstalar toda la máquina y simplemente meter un par de módulos de php, actualizar los locales y 4 chorradas más, se me pasa la lucecita de reiniciar... no vaya a ser... y efectivamente: la máquina no se levanta de nuevo.

Llamo a soporte, me atienden (siento el tono, estoy ya bastante molesto por este tema) y me dicen que lo están mirando de ayer aún (no sé el qué estarán mirando porque desde entonces ya he formateado la máquina, pero bueno...) y que espere al mail de fin de incidencia y vuelva a llamar.

Resumiendo, que tras cascar placa base y tarjeta de red, sustuituirmelas, no instalarme los drivers para las nuevas placas, darme errores el vKVM, pasar cerca 30 intervenciones en el servidor y casi 3 dias completos, e incluso reinstalando SO entero la máquina se va a la mierda en cuanto reinicias. OLE.

josu
05/06/2008, 10:06
Pues si no estás seguro de la "estabilidad" de ese servidor, me pensaría la posibilidad de alquilar uno nuevo y realizar un traslado de las páginas a éste.

Josu.

MarcosBL
05/06/2008, 09:41
Lo he hecho desde el Rescue que te facilitan, y ha pasado los test, pero desde el vKVM, que es como estar sentado delante viendo como arranca la BIOS, etc... el fsck peta dando incoherencias de RAM, el disco no se monta, etc... lo único que he logrado (y al final aún no me he acostado otra vez con la gracia) ha sido sacar copias de todo, y he puesto el servidor a reinstalar.

Respuesta por parte de los técnicos de OVH Francia ya no la puedo (ni soportaria francamente) esperar más, después de casi 3 dias en vela, 4 llamadas a soporte, 1 reinstalación de componentes y 30 intervenciones en la maquina.

Estoy reinstalando, ya os contaré si el problema era hard o no al final, pero sea como sea, al puro estilo de las películas "espero una satisfacción" por parte de OVH... porque después de la fé que he tenido en ellos, cuando he tenido este problema, que considero grave, y con un arreglo totalmente fuera de mis posibilidades al ser derivado de un fallo hardware suyo... la nula respuesta, ni como soporte, ni solicitando el pago de infogerencia, me ha decepcionado de una forma brutal.

josu
05/06/2008, 09:27
¿Estás seguro de que tu servidor da errores de RAM? Si es así pídeles amablemente a OVH que te pase un "memtest" al servidor. Con eso se debería ver rápidamente si la RAM es defectuosa.

http://www.memtest.org/

Josu.

MarcosBL
05/06/2008, 00:22
Esto va de mal en peor... siguiendo unas guias de google me he conectado por vKVM y he "visto" como arrancaba el servidor y no levantaba las tarjetas, asi que me he hecho:

emerge -C baselayout
rm /etc/init.d/net.*
emerge baselayout
etc-update
cd /etc/init.d
ln -sf net.lo net.eth0
ln -sf net.lo net.eth1

No estoy muy seguro de si los pasos son los debidos, pero con esto al bootear con vKVM el servidor detecta mis dos ips y sigue arrancando, y qué me encuentro ? Que que el SISTEMA DE FICHEROS ESTÁ CORRUPTO y no puedo acceder a /home para extraer las cosas que tenia pendientes.. asi que venga, tiro de fsck... pero nada... mientras está ejecutándolo DA ERRORES DE RAM y se peta...

Asi que estupendo, la placa madre mala sustituida, la tarjeta de red mala sustituida, pero no me actualizan los drivers ni la configuración de red, y ahora me encuentro con errores de HD y de RAM... qué me habeis puesto a mi ? El servidor que teneis para desahogar la violencia? Madre mia.. al menos ayer estaba tranquilo pensando que podria sacar los datos con el rescue... ahora ya ni eso, llevo un total de 26 intervenciones en la máquina (no, no exagero, las cuenta el manager) y lo único que obtengo es una y otra vez, la respuesta de que en modo Rescue arranca asi que está todo bien... acojonante.

Mañana por la mañana a las 9 lo primero que voy a hacer, por si las moscas, es certificar todo esto ante un notario, y a ver qué respuesta me da OVH Francia, porque en España me han atendido y entendido, pero en Francia empiezo a pensar que me están tomando el pelo con el hardware de esta máquina.

aicom
05/06/2008, 00:19
Imagino que ya lo habras tenido encuenta, pero... has probado en el foro de gentoo??

Saludos.

Power
04/06/2008, 23:08
Tratándose de ficheros generales que faltan, tal vez sería posible copiar esos ficheros desde la máquina de otro cliente que tuviese el mismo sistema operativo.
(Lo mismo estoy diciendo una burrada).

Saludos y ánimo, Marcos.

MarcosBL
04/06/2008, 22:59
Pues de nuevo lo mismo, que lo han mirado, que faltan ficheros y que me lo dejan en modo Rescue.. una noche más perdida.. hoy ya me acuesto porque llevo dos dias sin dormir...

Por lo que he investigado por mi cuenta, me falta la carpeta y todos los ficheros que deberian estar en /lib/rcscripts/net.modules.d (aparte de lo de bzimage), que por lo que he leido es consecuencia del cambio de placa y de tarjeta, pero parece que en Francia no les entra en la cabeza, una y otra vez me van al servidor, comprueban que el arranque da error de que no encuentra esos ficheros y me lo ponen en modo Rescue, cosa que no me sirve de nada, ya que no sé que hacer, y tampoco parecen querer cobrarme por arreglarlo...

Lo cierto es que es la primera vez en casi un año que tengo una queja de OVH, pero es que me parece increible ya lo que está pasando... sobre todo cuando el problema y su causa están perfectamente acotados y ambas partes sabemos que no ha sido cosa mia... en fin... ahora mismo estoy experimentando con el vKVM a ver si entre google y algo de inspiración fuese capaz de arreglarlo por mi mismo... aunque ya se me caen los párpados asi que casi mejor mañana os cuento cómo me ha ido... un saludo a todos.

MarcosBL
04/06/2008, 16:57
Gracias de nuevo a los dos aicom, Power.

Si, tengo backups de todo, o al menos de casi todo. Tengo todos los datos y código, me faltarian las docenas de ficheros de configuración "a medida" que tengo, pero incluso esos podria sacarlos (creo) en el modo rescue, más bien es un problema de que llevo cerca de un mes instalando y tuneando cosas en ese servidor, y como diga aqui en la empresa que tengo que retrasar esto un mes para volver a reinstalar todo a medida... me echan, y eso que soy uno de los socios, pero es que me matan.. xE

Yo por lo que entiendo del mail, al fastidiarse la placa y la tarjeta de red, al reiniciar el equipo parece como que se ha "borrado sóla" la configuración de red, no entiendo nada de hardware en linux, pero vamos, en windows pasa lo mismo cuando le cambias una tarjeta de red, tienes que volver a configurarla, por eso no tengo nada que decir y me parece normal, lo que me mata es que yo, simplemente, no tengo ni idea de por donde empezar con eso en modo rescue, y como se trata de una incidencia provocada por un malfuncionamiento de hardware, entiendo (en mi opinión, claro) que OVH podria ayudarme con esto, ya que no ha sido un mal uso por mi parte o algo que me haya cargado, sino algo que se ha producido debido al malfuncionamiento de ese hardware.

Por eso he solicitado la infogerencia, me da igual si es la de los 15 minutos que me corresponde como si tengo que pagarla gracias a dios no es problema de no querer pagar, el problema es un poco de "comunicación" España-Francia, ya que en España me han atendido muy amablemente por teléfono y han pasado la incidencia a Francia, pero parece que en Francia no salen del bucle de "Ok, voy a mirarlo, vaya, en modo Rescue funciona y responde al ping, debe ser cosa del cliente - Incidencia cerrada".

De todas formas acabo de llamar de nuevo, recordaban la charla de mediodia y me han confirmado que a pesar del email de respuesta "standard" si hay un técnico mirando qué ha podido pasar y comprobando si pueden arreglarmelo, ya os mantendré al tanto... tengo la "suerte de un quebrao" como dicen en el sur : )

Power
04/06/2008, 16:52
OVH a dia de hoy necesita mejorar mucho en ese aspecto.
El mejor soporte actual para los clientes de OVH-España es la ayuda que recibimos de otros colegas en este foro.

Saludos

aicom
04/06/2008, 16:46
Cita Publicado inicialmente por MarcosBL
Muy agradecido aicom, en serio que lo aprecio, pero el problema es la multitud de configuración " a medida " que tiene ese servidor, es para una app de intranet para nuestra empresa y lleva cientos de módulos añadidos a php, apache, etc... lo que me mata es tener que volver a empezar a configurar todo eso, si no ya lo habria reinstalado desde el manager y pista, pero sabiendo que los discos duros están bien, me mata terriblemente tener que volver a empezar con todo eso.

Acabo de recibir mail de soporte francia de que el servidor en modo rescue funciona bien y que cierran la incidencia... aunque en modo HD sigue sin arrancar, es decir, que ni por infogerencia... esto ya me está matando xE
******

Si quiere que OVH se encargue de la resolución del problema, se abrirá un "ticket" de intervención de nivel 3.




El soporte nivel 3


El soporte nivel 3 interviene en su servidor para resolver el origen del problema que ha sido detectado en el soporte nivel 2.
Esta operación se efectua en el cuadro de un contrato de infogerencia. Sólo se efectúan infogerencias de operaciones que conocemos a la perfección. Un presupuesto orientativo se elabora antes de la intervención.

En el cuadro de un servidor profesional, tiene derecho a 15 minutos de soporte nivel 3 al mes gratuítamente (no acumulables).

*******

Eso es lo que indican en su web, lo que no entiendo es como pretenden que soluciones un fallo en el servidor, si ni tan siquiera ellos, que tienen acceso fisico al equipo pueden hacerlo.

Yo hace unas semanas solicite a traves de infogerencia que actualizaran un FC4 con plesk 8 a plesk 8.3 y tampoco fueron capaces.

OVH a dia de hoy necesita mejorar mucho en ese aspecto.

Suerte.

Power
04/06/2008, 16:39
find: /lib/rcscripts/net.modules.d: No such file no interface module has been loaded
Hola,

Aparte de cambiar placa base y tarjeta de red, después parece que daba error de que no encontraba el fichero del módulo del interface de red.
(O eso al menos me parece entender)

Y el mismo problema con el fichero bzImage

Y por eso, como el kernel y su módulo de red no iban, creo que era por lo que lo dejaban en modo Rescue.

De todas formas es una avería muy extraña: placa base averiada, tarjeta de red averiada y ficheros desaparecidos .

No es por desanimarte, pero ¿tienes un backup actual?
No sería de extrañar que tengas que volver a reinstalar desde cero.

Siento no poder ayudarte más pero mis conocimientos son muy limitados.
Eso sí, cuentas con el apoyo y ánimo de muchos colegas.

Suerte !!!

MarcosBL
04/06/2008, 16:33
Muy agradecido aicom, en serio que lo aprecio, pero el problema es la multitud de configuración " a medida " que tiene ese servidor, es para una app de intranet para nuestra empresa y lleva cientos de módulos añadidos a php, apache, etc... lo que me mata es tener que volver a empezar a configurar todo eso, si no ya lo habria reinstalado desde el manager y pista, pero sabiendo que los discos duros están bien, me mata terriblemente tener que volver a empezar con todo eso.

Acabo de recibir mail de soporte francia de que el servidor en modo rescue funciona bien y que cierran la incidencia... aunque en modo HD sigue sin arrancar, es decir, que ni por infogerencia... esto ya me está matando xE

aicom
04/06/2008, 15:11
Cita Publicado inicialmente por MarcosBL
En soporte de OVH España me acaban de confirmar que efectivamente ha sido sustitución de placa y tarjeta de red... hay que tener bien mala pipa y bien mala suerte...

Respecto a lo de solucionarme el tema de que el servidor se haya desconfigurado a nivel de red al hacer esta sustitución, han quedado en contactar ellos con Francia y decirme algo esta tarde a ver si se puede meter por infogerencia... sigo sudando sangre... ya os cuento.
Compañero, si necesitas un kemsirve mientras te lo solucionan, solo tienes que decirmelo.

Saludos y suerte.

MarcosBL
04/06/2008, 14:43
En soporte de OVH España me acaban de confirmar que efectivamente ha sido sustitución de placa y tarjeta de red... hay que tener bien mala pipa y bien mala suerte...

Respecto a lo de solucionarme el tema de que el servidor se haya desconfigurado a nivel de red al hacer esta sustitución, han quedado en contactar ellos con Francia y decirme algo esta tarde a ver si se puede meter por infogerencia... sigo sudando sangre... ya os cuento.

MarcosBL
04/06/2008, 13:52
Muchisimas gracias a los dos, al menos ya sé que no soy el único.

En este caso tras pedir ayuda a soporte me ha llegado otro email de incidencia en el que indica lo siguiente:

Date: 2008-06-03 18:55:37 : ns201719.ovh.net detected as down Date 2008-06-03 19:39:10, Thomas made Component replacement: Probleme avec carte mere et carte 3ware remplacement carte mere et carte 3ware reboot en DD
Erreur:
find: /lib/rcscripts/net.modules.d: No such file no interface module has been loaded

Ne demarre pas les services
carte reseau eteinte
meme probleme en bzImage
test en rescue ovh: Ping ok, services ouverts

mise en rescue pro pour reparation software par le client ping ok, services ouverts


A ttulo informativo, el tiempo de resolucin del incidente ha sido de:
4h 23m 3s
No entiendo ni papa de francés, pero según el traductor de Google, ha habido algún problema de hardware en la placa madre y la tarjeta de red O_o lo que me acojona bastante... además según el email me han dejado el servidor en modo Rescue, ya que consideran que si responde a pings ya no es problema de la maquina sino mio... pero tras pasar el boot de nuevo a disco duro el equipo no ha arrancado de nuevo, cosa que en principio, si he entendido bien y se le ha cambiado placa madre y tarjeta de red, no me extraña.

He mandado otro email a soporte porque no tengo ni remota idea de cómo solucionar esto, una cosa es que haya aprendido a base de ensayo y error a instalar un paquete, actualizar el equipo y "tunear" mysql, apache y php, pero ya a nivel hardware... soy hombre al agua. Tras varios intentos lo único que consig es que vayan al equipo, lo reinicien en modo rescue y me manden de nuevo las claves del modo rescue, con lo cual sigo de la misma manera y llevo ya casi dia y medio sin dormir xE

Entiendo perfectamente que los servidores no son "managed", y comprendo que si en modo Rescue el servidor responde al ping, en el 99.9% de las ocasiones sea problema del usuario, no tengo nada que decir a esto por parte de OVH, pero en este caso ha sido un componente hardware el que se ha roto, y lo que ha provocado el problema, esperaba que alguien me lo solucionase, ya que imagino que será algo trivial, aunque se me escape, de reconfigurar las tarjetas de red... sigo intentando que me cojan el teléfono a ver si en españa me lo pudiesen solucionar o si por lo menos puedo usar esos 15 minutos de infogerencia que tengo, o contratar los que necesite para que alguien me pueda solucionar esto.

Gracias por vuestros comentarios, os contaré como ha ido todo.

David
03/06/2008, 22:34
A mi hace unos meses me paso algo similar. Tras un reinicio rutinario para actualizarlo paso exactamente lo mismo, lo intente en varias ocasiones haciendo un proceso similar al tuyo y cada vez que lo intentaba iniciar normalmente se caía.

En mi caso si me dejaba acceder a los datos, desde allí hice los diferentes test e intente arreglarlo. Según me dijeron se podría tratar de un problema en la configuración de los dispositivos de red, pero lo revise una y otra vez no lo logre solucionar. Así que tuve que reinstalar el servidor.

Por otro lado es normal que no te deje reiniciar en modo Rescue, para reiniciarlo primero tienes que cambiar el boot a normal o netboot y solicitar el reinicio, de ese modo se reiniciará, si todo va bien debería arrancar normal, si no, te caerá otra vez y volverá a entrar en modo Rescue.

Siento no poder ayudarte mucho más que contarte lo que a mi me paso.

aicom
03/06/2008, 22:31
Solo te podran solucionar desde soporte, enviales un mail que suelen solucionarlo en pocas horas, te lo comento porque eso mismo me ha pasado a mi durante alguna que otra reinstalacion del SO solo que nunca recibi el correo que comentas, el Servidor se quedaba en modo rescue y no habia manera.

Suerte.

MarcosBL
03/06/2008, 21:03
Esta tarde intenté cambiar el boot de mi servidor ns201719 del arranque en disco a netboot, como tengo el resto.

Sin embargo, esta vez, una vez reiniciado el equipo no arrancó. Volví a poner el arranque desde disco duro y solicité un reinicio desde el manager, como siempre, pensando que cualquier cosilla habría dejado el arranque por netboot sin funcionar.

Desde entonces no he podido conectarme al servidor por SHH, ni responde al ping, ni nada... Me ha llegao un email de que el servidor se encuentra en modo Rescue (algo que yo no he activado en el manager, segurisimo) con unos datos de acceso para SSH y una interface web... pero ni puedo acceder a el por SSH con los datos facilitados, ni por web con los datos indicados, ni responde al ping... ni nada.

Para acabar de redondear la situación, cuando solicito un nuevo reinicio el manager me dice que el servidor no puede ser reiniciado en este estado.

¿ A alguien más le ha pasado esto ? ¿ Se os ocurre algo ? Porque ni arranca, ni puedo acceder al modo Rescue, ni me deja hacer un reinicio el manager, asi que me he quedado un poco con cara de tonto...