We are in the process of migrating this forum. A new space will be available soon. We are sorry for the inconvenience.

Servidor se cuelga a los X minutos


Lordchip
10/02/2015, 22:25
Gracias por la respuesta alvaro. El problema es un problema de sincronismo del raid por software debido a la velocidad de uno de los discos, al ser un servidor en produccion, y tras esperasr 12 horas a que me diga ovh que me cuenta 20 euros el diagnostico del fallo; Ya he copiado todo y trasladado a otro servidor de otra empresa.. es una lástima ver que he llegado a tener 40 servidores y que solo me queden dos que uso mas para pruebas que otra cosa en ovh. Deberian al menos, con los que llevamos mas de 5 años contratando, y pagando cada 6 u 12 meses los servidores, dar un servicio un pelin mejor. Pero bueno, este es un foro para soporte y no para quejas xD asi que simplemene gracias por los consejos alvaroag.

alvaroag
10/02/2015, 02:00
Probablemente sea por un tema de hardware.... Prueba lo siguiente:

1. Configurale un firewall y asegúrate de dejar abiertos sólamente los puertos necesarios para tu acceso (ICMP y SSH). No sea que alguien esté atacando tu servidor ypor algún error de seguridad lo estén llegando a colgar. Inclusive, no sería mala idea que le cierres el acceso a internet, también con un firewall, no vaya ser problema de un rootkit que te hayan colado.
2. Verifica bien en el log (syslog, messages, kernel, dependiendo de tu configuración), sobre todo en torno a la hora del último cuelgue. Mira bien que mensajes hay antes del siguiente inicio del kernel.
3. Déjalo apagado por unas horas. No vaya ser que sea una falla de hardware o un recalentamiento, y dejarlo apagado unas horas puede darte más tiempo para analizar logs, ejecutar diagnósticos, o hacer copia de la información antes de contratar un nuevo servidor. Recuerda, si se tratase de una falla de hardware, debes cambiar de servidor lo antes posible, a menos que OVH te solucione el problema a nivel de hardware.

Lordchip
09/02/2015, 23:42
Hola, os escribo por si alguien me puede dar una ligera pista de la solución al problema que tengo.
Llevo con un servidor como 4 años sin problemas, actualizado, y se supone bien configurado debido a que los ataques etc.. por ahora no me provocan dolores de cabeza.
Hoy a eso de las 17:00 horas lo veo caido... lo reinicio me meto en /var/log/syslog para ver que paso no veo nada raro o inusual.. igual en kernel.log etc.. reviso intrusiones en wtmp y nada todo ok.. pero a los 3 minutos el ssh se me cuelta. Pruebo ping etc.. y no hay acceso.

Lo vuelvo a reiniciar y todo ok hasta que pasan unos 2 o 3 minutos y de nuevo todo colgado. ¿alguna pista de que puedo mirar?
no me da tiempo a instalarle cosillas deltipo de revision de temperatura en discos procesador etc.. porque no le da tiempo a instalarlos..

¿alguna idea de por donde puede venir el problema o que hacer?

pd: resulta que cuando lo arranco en modo rescue no puedo acceder porque las contraseñas la envian a un dominio que tiene correo en este servidor y he cambiado el email desde el manager pero no me llega la password de rescue.

saludos! y gracias por anticipado por las ideas./respuestas.