OVH Community, your new community space.

Los daemons sshd httpd nxserver no responden. Si hay respuesta al ping


juanillo
24/06/2009, 17:41
Hola, yo toco madera porque llevo 22 dias online y no lo tengo caído.

Su usas la release2 mira en el manager que kernel tienes en el netbot. Yo llevo estos 22 dias con el 2.6.29.3-rt12-xxxx-rt12-ipv6-32. Si llevas otro cambialo y reinicia de nuevo. Espera 15 minutos y si no va, reinicia de nuevo. Dale tiempo, no le pegues reinicios cada 5 minutos. A mi en otros servidores se me bloquea 15 minutos el reboot desde el manager. No sé por qué no dice eso en los rps ... igual es porque no renician xd ...

Por el otro hilo leí que te decian algo sobre que si tiraba mucho de disco igual se bloqueaba. Puede ser; yo lo he pensado alguna vez.
En mi rps tengo poco trafico, no tengo emails ( los pasé por google apps ) y el csf+lfd en modo paranoico para que no me lo tiren. Fijate si está paranoico el csf que si descargo desde casa por ftp el contenido de un site me bloquea mi ip por demasiadas conexiones. Y con todo esto ... 22 dias sin caer. Igual no tiene nada que ver y pasado mañana se cae por cuenta propia, pero en fin, ... que le he reducido la carga al máximo.

suko22
24/06/2009, 09:37
Me uno a vuestro problema, llevo así desde el sábado 20 de junio, sin poder acceder ni por http, ni sshd ni de ninguna otra forma. Cuando al servidor le da por estar online va rápido y sin problemas, pero son sólo unas pocas horas al día, el resto está offline.

He probado con varios hardreset y, aunque todo funciona bien después, apenas dura unos minutos. Como bien decís, en mi caso tampoco he tocado nada en la configuración del rps, así que estos fallos vendrán por otro lado.

Como es de esperar por parte de OVH, la respuesta del servicio técnico ha sido nula (más allá de los mensajes automáticos de fallo y "arreglo mágico").

mrc
06/06/2009, 14:55
Cita Publicado inicialmente por kitamarchas
Que yo sepa, por defecto, los rps, utilizan kernel de red, no el HD... no te lo garantizo, no voy a reinstalar para averiguarlo, pero pondría la mano en el fuego por que así es...
Pues, yo usaba el de hd y no el kernel de red,pero aun asi el kernel no es el problema aqui,sino los continuos reinicios de cada cierto tiempo,para que todo vuelva a la normalidad,si puedes llamar a eso normalidad .

kitamarchas
06/06/2009, 14:50
Que yo sepa, por defecto, los rps, utilizan kernel de red, no el HD... no te lo garantizo, no voy a reinstalar para averiguarlo, pero pondría la mano en el fuego por que así es...

mrc
06/06/2009, 14:44
Muchas gracias por vuestras respuestas,soluciones,etc.
Pues en mi caso lo tenia en hd,como viene por defecto, nada de kernels en red,actualizacion por aptitude update, y poco mas, ademas el servidor funcionaba bien,y de repente no me podia conectar de ninguna forma al ssh, no respondia a nada, lo reiniciabas daba igual en que modo, seguia sin responder, a nada,lo mas probable es que fuera un problema tecnico, porque software ni de coña, solo es muy dificil que pete solo,pues sin tocar nada,sin apenas darle uso.
Me explico, el servidor estaba en idle,sin descargar nada, sin subir nada, haciendo uso solo de ssh y http, lo de http mas que nada para streaming para uso propio claro.
Lo mas indignante de todo esto, es que no me han dado una respuesta aun porque pasa esto. No me vale con que me envien del soporte tecnico que si el servidor responde a pings, no es un fallo hardware asi que ellos no se tienen que ocupar de nada,vamos a ver si nadie toca nada,y de repente el servidor se queda frito,sin intervencion por mi parte, de quien es la culpa ?
Mia del administrador,como dicen ellos,o suyo?
Estoy segura de una cosa, el problema no era por mi parte,una mala configuracion del servidor,elegir mal algunas opciones de netboot,si ni siquiera he tocado nunca el netboot hasta ahora.Yo no soy el causante de dicho fallo, por lo tanto,tiene que ser por hue**s problema suyo.
Estoy contento,para el uso que le doy a este rps con su rendimiento,el uso? servidor personal,uso propio y unico. Nada de pruebas,instalar,reinstalar,no le veo el sentido,para eso tengo mi VirtualBox.

Saludos,mrc.

kitamarchas
04/06/2009, 23:27
Hay que tener cuidado con las actualizaciones, en caso de que estemos usando un kernel de red de OVH.

Si estamos utilizando un kernel de red, y en las actualizaciones de Ubuntu, instalamos las actualizaciones "linux-headers" pues es normal que despues del reinicio pete... me explico...

Cuando Ubuntu nos obliga a reiniciar, durante el reinicio se realizan diversas tareas (no me preguntéis cuales) pero si hemos actualizado "linux-headers", pues en el reinicio, efectuará tareas de mantenimiento sobre el kernel ¿pero cual? el que estamos arrancando del netboot o el que hemos actualizado?

El tema es que dichas tareas de mantenimiento, el SO las intentará realizar sobre la versión que hemos actualizado, sin embargo, estamos arrancando con otro... normal que se haga la picha un lio... entendéis? me he explicado?

Salu2!!

juanillo
04/06/2009, 22:31
Me alegro de que lo tengas solucionado, aunque has tardado bastante .... 4 dias es mucho. ¿ no sera que lo tenias en boot por hd ? ... mejor usa los kernels del netoboot y te despreocupas. Yo ahora mismo tengo el 2.6.29.3
El tuyo es viejo, mira en el real time monitoring del manager que te sale en color rojo el kernel. El ultimo es el 2.6.28.4
Te diría que reiniciases sobre el ultimo kernel o sobre la beta ... pero no me atrevo a decirtelo no sea que se te quede colgado y te acuerdes de mí .. jeje ..

Yo tengo el rps desde febrero y se habra quedado fuera de linea por motivos extraños 3 veces, 4 quizas, no recuerdo bien pero no han sido muchas.

Recuerdo las 2 ultimas. En la penultima lo dejé caído una noche y a la mañana siguiente seguía igual. Envie un ticket y "con un simple netboot" lo levantaron. Sobre el kernel 2.6.29.3
Esta ultima, pues lo reinicie 3 veces creo, con un kernel, otro, y al rato inició en el 2.6.29.3

Si te vuelve a pasar, reinicia por netbot con un kernel, con otro y veras que al final arranca. Por lo menos eso es lo que me ha pasado a mi.

mrc
03/06/2009, 02:15
Hola,juanito gracias por contarme tu caso, al enviar un email a soporte me responden lo siguiente:

Código:
Buenos días,
Tiene todos los puertos cerrados tiene que abrirlo a través del modo rescue :
 
http://guias.ovh.es/ModoRescue
Digo bueno por si las moscas, hago lo siguiente:
escaneo con nmap el puerto ssh que en este caso es el 41428,ojo que especifico exactamente, que uso el puerto 41428 para conectarme a ssh,a lo que voy:
nmap -vvv 91.121.204.34 -p 41428

Código:
Starting Nmap 4.62 ( http://nmap.org ) at 2009-06-03 02:42 CEST
Initiating Ping Scan at 02:42
Scanning 91.121.204.34 [1 port]
Completed Ping Scan at 02:42, 0.12s elapsed (1 total hosts)
Initiating Parallel DNS resolution of 1 host. at 02:42
Completed Parallel DNS resolution of 1 host. at 02:42, 0.13s elapsed
DNS resolution of 1 IPs took 0.14s. Mode: Async [#: 1, OK: 1, NX: 0, DR: 0, SF: 0, TR: 1, CN: 0]
Initiating Connect Scan at 02:42
Scanning rps2922.ovh.net (91.121.204.34) [1 port]
Discovered open port 41428/tcp on 91.121.204.34
Completed Connect Scan at 02:42, 0.12s elapsed (1 total ports)
Host rps2922.ovh.net (91.121.204.34) appears to be up ... good.
Interesting ports on rps2922.ovh.net (91.121.204.34):
PORT      STATE SERVICE
41428/tcp open  unknown
bueno como ven el puerto esta abierto, no creo que haya que abrir ningun puerto, pues segun nmap esta abierto, aparte de eso, lo raro de todo, es que, al darle a conectar a ssh, el servidor se queda sin respuesta, lo dejo asi, abro otra pestaña shell y al darle un, netstat -an -t tcp | grep -i 41428 me da lo siguiente:
Código:
tcp        0      0 192.168.1.5:37245       91.121.204.34:41428     ESTABLECIDO
Esto se convierte cada vez de mas raro en mas raro :confused: .

La segunda respuesta que me dan es la siguiente:
Código:
Buenos días,
 
el mail tarda 15 min en enviarse tras el reinicio...
Puede probar a reiniciar en rescue, y borrar archivos temporales .nx en el servidor.
Cuando se refieren a borrar archivos temporales .nx en el servidor, mi pregunta es como voy a poder borrar archivos temporales .nx en el servidor si es que no puedo conectarme siquiera via ssh,(si se refieren al cliente desde el cual me conecte, como comente en mi primer post, intente conectarme desde un equipo limpio sin el cliente nx instalado, lo instale y la cosa seguia igual). No recibo el mail del manager por mucho que le de a las "malditas opciones" (sera porque uso opera ? intentare con mozilla a ver lo que pasa), no hay manera, muchos hard reset, todas las variantes de netboot y ningun email, ni siquiera uno, bueno uno que te avisa de que alguien se ha conectado al manager, la fecha,hora y la ip, pero nada mas,si no hablo de esperarar 15 minutos, esperar 15 minutos, claro que si, he esperado mas de un dia, llevo ya 4 sin poder hacer absolutamente nada .

La unica solucion que le veo a esto, es o cambiarme totalmente de servidor o volver a reinstalar, pero tengo miedo de que me pase lo mismo que ahora, vamos a ver, si ni siquiera recibo el dichoso mail que supuestamente deberia llegar en un maximo de 15 minutos, el unico miedo que tengo es reinstalar cuando el S.O. esta en perfecto estado, y ojo que no hice ningun tipo de prueba para ver cuantas conexiones aguanta o ningun tipo de benchmarking para ponerlo a prueba.

"Juanito al final como conseguiste volver a tener acceso al servidor ? que es exactamente lo que has hecho, o que es lo que podria hacer, Muchisimas Gracias!"

Por favor, si hay alguien que puede hacer algo, o si tiene alguna solucion a todo esto que lo diga, muchas gracias por vuestra paciencia y ayuda.

"Por fin funciona!!", no me lo creo aun, que hice, pues lo de siempre cambiarle en netboot el modo de arranque a un kernel predefinido, me funciono con la opcion, 2.6.27.10-grsec-xxxx-grs-ipv4-32 , ahora toca ver si funciona con la opcion default, hd, no se exactamente que kernel tengo en modo hd, lo unico que se, es que el servidor lo he ido actualizando siempre que salian actualizaciones, Ahora tambien he ido recibiendo los emails, modo kvm,etc. Los anteriores emails para modo kvm nunca me han llegado, pero estoy feliz,gracias a dios, todo esta en orden por ahora, "a ver lo que dura!!" Vamos a iniciar sesion nx, a ver lo que pasa, funciona todo en orden,aunque esto acabo con un final feliz, sigo desesperadamente con las ganas de saber porque pasa esto, si es por nuestra culpa,los usuarios, o es algun fallo tecnico ?
El uso que le doy al rps es minimo, vamos que no lo fuerzo casi nada,seguramente espero que no sea el caso, tendre que volver a reiniciar tendro de 27,28 dias, lo mas que me ha durado sin reiniciar "hard reset" creo que fueron 46 dias fue un logro! La calidad de conexion y servicios ovh es buenisima, tienen un precio calidad imbatible,pero eso de reinicar cada cierto tiempo para que funcione todo con normalidad no lo veo normal, y mucho menos en un rps, si es lo normal, alguien que lleva bastante tiempo,haciendo uso de los servicios ovh,en concreto servidores de tipo rps, que nos cuente si le pasa lo mismo, o tuve la mala suerte de ser uno de los pocos?.


Muchisimas Gracias a tod@s!!

Saludos,mrc.

juanillo
02/06/2009, 09:44
Por aqui exactamente el mismo problema cada X/dias. La ultima vez el domingo 31 sobre las 10am .... y van 2 o 3 veces ya. La anterior hace un par de semanas que resolvieron reiniciando los tecnicos.

1) el rps lleva unos cuantos dias/semanas online sin problemas.
2) de repente un dia veo todas mis webs inaccesibles. pruebo ssh y tambien inaccesible; desde casa o desde otro servidor OVH. El rtm se queda "congelado". Si observo la grafica de trafico se ve que se ha quedado en un "cero" desde el incidente. El trafico "actual" es el justo para responder a los pings; unos pocos bps. No hay incidencia de servidor caído por eso mismo, porque hay ping.
3) reinicio desde manager; sigue igual. Vuelvo a reiniciar desde manager con otro netboot, sigue igual. Y así hasta que le da por funcionar, que ya dudo si es porque reinicia desde manager o porque solucionan el problema en otro lado los tecnicos.

Incluso he llegado a pensar que no me funciona el reinicio desde el manager. No sé; o que se queda inaccesible el disco duro ... yo qué sé ...

La vez anterior pensé que me habia cargado el rps por hacerle una carga excesiva con un test de conexiones. Pero esta vez ( domingo 31 ) ha sido él solito sin exceso de carga que se ha venido abajo.
Intenté como tú reiniciar en kvm y me pasó lo mismo; no me llegaban los emails de acceso.

mrc
02/06/2009, 02:16
Hola llevo varios dias teniendo el mismo problema, muchas veces al intentar conectarme al servidor via ssh no recibo ninguna respuesta nada, absolutamente nada, claro al no poder conectarme por ssh no puedo tener acceso al control del servidor ni tampoco a los servicios nx.
De hecho, no solo es el servicio ssh sino tambien el http, en definitiva no puedo conectarme de ninguna forma al servidor, antes para solucionar el problema de alguna forma,recurria al manager para darle un hard reset, una vez reiniciado el servidor, los servicios empezaban a funcionar correctamente (sshd httpd nx,etc).
Lo raro en todo esto, el servidor no aparece como caido, y responde a los pings de las 2 ip.
Un problema de configuracion en los conf queda totalmente descartado ,pues no hay ningun fallo de configuracion en los conf, si habria algun fallo, otros dias no podria conectarme o simplemente al darle un /etc/init.d/servicio restart,el mismo sistema me lo indicaria.
Antes me pasaba lo mismo, pero solo pasaba cada 27, 28 dias, los daemons ssh nx http no respondian a nada, como si se quedaran fritos o en espera todo el rato,reinicio el servidor, y todo como nuevo.
Llevo muchisimo tiempo de esta forma,con tener que reiniciar cada cierto tiempo solo para poder conectarme via ssh o nx. Ahora no consigo tener una respuesta por parte de ningun protocolo (ssh,http,etc).

La cuestion es que en soporte, me dijeron que borrara los ficheros .nx cosa que hice, pero sigo igual sin respuesta por parte del protocolo ssh, he intentado conectarme desde varios sistemas operativos diferentes, por si es el sistema operativo, pero nada, sigo igual,actualmente uso ubuntu linux, y nunca tuve problemas conectarme via ssh desde linux, pero bueno, dije vamos a intentarlo, dicho y hecho,al intentar conectarme desde xp,vista o redhat me pasaba lo mismo,no recibia ninguna respuesta por parte del servidor.

Haciendo ssh -vvp 41428 admin@91.121.204.34 me pone lo siguiente:
Código:
OpenSSH_5.1p1 Debian-3ubuntu1, OpenSSL 0.9.8g 19 Oct 2007
debug1: Reading configuration data /etc/ssh/ssh_config
debug1: Applying options for *
debug2: ssh_connect: needpriv 0
debug1: Connecting to 91.121.204.34 [91.121.204.34] port 41428.
debug1: Connection established.
debug1: identity file /home/usuario/.ssh/identity type -1
debug2: key_type_from_name: unknown key type '-----BEGIN'
debug2: key_type_from_name: unknown key type '-----END'
debug1: identity file /home/usuario/.ssh/id_rsa type 1
debug1: Checking blacklist file /usr/share/ssh/blacklist.RSA-2048
debug1: Checking blacklist file /etc/ssh/blacklist.RSA-2048
debug2: key_type_from_name: unknown key type '-----BEGIN'
debug2: key_type_from_name: unknown key type '-----END'
debug1: identity file /home/usuario/.ssh/id_dsa type 2
debug1: Checking blacklist file /usr/share/ssh/blacklist.DSA-1024
debug1: Checking blacklist file /etc/ssh/blacklist.DSA-1024
Aunque ponga established, no me da ninguna respuesta,he intentado con netboot desde el manager de ovh, por mucho que le de a iniciar en kvm no recibo el mail con la direccion tipo,he intendado reiniciar varias veces,hard reset, sigo igual,he intendado,en netboot cambiandole en arranque otro kernel,sigue igual, sin respuesta,como ven por mucho que reinicie no hay manera, ni siquiera por kvm, no entiendo porque no recibo siquiera el mail con la direccion para poder conectarme via web ?

Muchas gracias de antemano,cualquier consejo ayuda!