OVH Community, your new community space.

Problema cuelgue servidor: OOM killer


oscar8x
11/06/2008, 11:28
Pues el problema de todo es que los procesos http ocupan mucha memoria. No entiendo mucho a que se debe, además cuando más se llena es entre 23.00 y 4.00 de la mañana.

El servidor es un Dual Core E2180 2Ghz, 1Gb ram, 750Gb de disco y le tengo ahora 1.5Gb de swap. Tengo alojado 26 dominios con 20 webs activas que tienen poco tráfico. Entre todas no llegan a 45Gb mensuales de tráfico.

A mi esto me suena a algún ataque. Hay un foro de un cliente instalado, pero tiene poca afluencia.

josu
06/06/2008, 09:39
El swap es la última alternativa, si tienes problemas de memoria deberías mirar las causas... y si no hay forma de rebajar su uso, contratar un servidor más potente. Si tu servidor empieza a tirar de swap se va a degradar mucho su rendimiento, aunque quizás según el uso que le des pueda ser aceptable.

Josu.

oscar8x
05/06/2008, 14:42
De momento he probado a crear un fichero swap de 1Gb y activar las slow-query de mysql.

MarcosBL
05/06/2008, 12:45
Por si te sirve de algo, lei algo acerca de esto en:

http://linux.derkeiler.com/Mailing-L...ads.html#00062

Concretamente es el post "OOM killer "Out of Memory: Killed process" SOLUTIONS / SUMMARY, Eric Sisler" y sus respuestas, creo que por ahi pueden andar los tiros.

oscar8x
05/06/2008, 12:39
Pues tengo un servidor Fedora Core 4 + Plesk 8.4 y 2 veces a la semana o a veces 3 se me muere el Mysql, o el named y tengo que hacer el reinicio hardware desde el Manager.

He mirado los logs de /var/log/messages y encuentro logs del tipo

Código:
Jun  4 22:57:39 xxx kernel: Out of memory: kill process 22265 (httpd) score 23816 or a child
Jun  4 22:57:39 xxx kernel: Killed process 22265 (httpd)
Jun  4 22:57:39 xxx kernel: httpd invoked oom-killer: gfp_mask=0x201d2, order=0, oomkilladj=0
Jun  4 22:57:39 xxx kernel:  [] out_of_memory+0xea/0xf7
Jun  4 22:57:39 xxx kernel:  [] __alloc_pages+0x22c/0x2c9
Jun  4 22:57:39 xxx kernel:  [] __do_page_cache_readahead+0x10b/0x144
Jun  4 22:57:39 xxx kernel:  [] filemap_nopage+0x2e1/0x365
Jun  4 22:57:39 xxx kernel:  [] scsi_finish_command+0x40/0x5b
Jun  4 22:57:39 xxx kernel:  [] do_no_page+0x91/0x306
Jun  4 22:57:39 xxx kernel:  [] __handle_mm_fault+0x188/0x2ed
Jun  4 22:57:39 xxx kernel:  [] do_page_fault+0x169/0x6f0
Jun  4 22:57:39 xxx kernel:  [] sys_stat64+0x29/0x2b
Jun  4 22:57:39 xxx kernel:  [] do_page_fault+0x0/0x6f0
Jun  4 22:57:39 xxx kernel:  [] error_code+0x73/0x80
Jun  4 22:57:39 xxx kernel:  [] dm_crypt_init+0x1a/0xab
Jun  4 22:57:39 xxx kernel:  [] unx_create_cred+0x8/0xf7
]

Código:
Jun  4 22:57:40 xx kernel: rtm invoked oom-killer: gfp_mask=0x201d2, order=0, oomkilladj=0
Jun  4 22:57:40 xxx kernel:  [] out_of_memory+0xea/0xf7
Jun  4 22:57:40 xxx kernel:  [] __alloc_pages+0x22c/0x2c9
Jun  4 22:57:40 xxx kernel:  [] __do_page_cache_readahead+0x10b/0x144
Jun  4 22:57:40 xxx kernel:  [] filemap_nopage+0x2e1/0x365
Jun  4 22:57:40 xxx kernel:  [] pipe_read+0x1cb/0x2a2
Jun  4 22:57:40 xxx kernel:  [] do_no_page+0x91/0x306
Jun  4 22:57:40 xxx kernel:  [] __handle_mm_fault+0x188/0x2ed
Jun  4 22:57:40 xxx kernel:  [] do_page_fault+0x169/0x6f0
Jun  4 22:57:40 xxx kernel:  [] dput+0x18/0x129
Jun  4 22:57:40 xxx kernel:  [] do_page_fault+0x0/0x6f0
Jun  4 22:57:40 xxx kernel:  [] error_code+0x73/0x80
Jun  4 22:57:40 xxx kernel:  [] unx_create_cred+0x8/0xf7
Jun  4 22:57:40 xxx kernel:  =======================
Por lo que he leído brevemente (aún no he tenido mucho tiempo) parece ser de problemas de swap muy pequeña.

Sin embargo, me parece que mi sistema no está usando la swap (no lo he tocado desde que me lo entregaron) salvo que he puesto Plesk 8.4 y webmail Roundcube.


Os detallo más información para ver si me podeis ayudar.

Resultado de "free" (1 hora despues de reiniciar el servidor)

Código:
             total       used       free     shared    buffers     cached
Mem:       1022924     840208     182716          0      39092     200768
-/+ buffers/cache:     600348     422576
Swap:       522104          0     522104
Resultado del "df"

Código:
S.ficheros         Bloques de 1K   Usado    Dispon Uso% Montado en
/dev/sda1             10317828   8855828    937884  91% /
/dev/sda2            710243928   6885768 667279788   2% /var
/dev/shm                511460         0    511460   0% /dev/shm

fstab
Código:
/dev/sda1       /       ext3    errors=remount-ro       0       1
/dev/sda2       /var   ext3    defaults,usrquota,grpquota                0     $
/dev/devpts             /dev/pts                devpts  gid=5,mode=620  0 0
/dev/shm                /dev/shm                tmpfs   defaults        0 0
/dev/proc               /proc                   proc    defaults        0 0
/dev/sys                /sys                    sysfs   defaults        0 0
/dev/sda3       none    swap    defaults                0       0