Buenas a todos tengo un problema al realizar los snapshots en uno de los servidores dedicados con Proxmox que administro desde hace una semana, esta máquina tiene alojados 2 containers Centos 6 + Plesk 12 con 200 y 100 suscripciones respectivamente cada una, por lo que tienen alojados muchos pequeños ficheros.
El peso de cada backup de cada container con LZOP, actualmente debe rondar los 148 GB y 137 GB, tardando en finalizarse unas 6-7 horas. Dado el problema reportado, el típico "Read error at byte 0, while reading 4608 bytes: Input/output error" cambié la configuración para usar una carpeta NFS de un servidor de backups, y el primer día esta configuración funcionó bien, aunque tardando unas 9 horas.
Esta máquina cuenta con 32 GB de RAM y 2 HDD HARD RAID 1 con EXT4
Adjunto copia de mi configuración y logs:
Código:
### vzdump.conf
size: 121856
Código:
### pveversion -v
proxmox-ve-2.6.32: 3.4-157 (running kernel: 2.6.32-37-pve)
pve-manager: 3.4-6 (running version: 3.4-6/102d4547)
pve-kernel-2.6.32-32-pve: 2.6.32-136
pve-kernel-2.6.32-39-pve: 2.6.32-157
pve-kernel-2.6.32-37-pve: 2.6.32-150
pve-kernel-2.6.32-34-pve: 2.6.32-140
pve-kernel-2.6.32-38-pve: 2.6.32-155
lvm2: 2.02.98-pve4
clvm: 2.02.98-pve4
corosync-pve: 1.4.7-1
openais-pve: 1.1.4-3
libqb0: 0.11.1-2
redhat-cluster-pve: 3.2.0-2
resource-agents-pve: 3.9.2-4
fence-agents-pve: 4.0.10-2
pve-cluster: 3.0-18
qemu-server: 3.4-6
pve-firmware: 1.1-4
libpve-common-perl: 3.0-24
libpve-access-control: 3.0-16
libpve-storage-perl: 3.0-33
pve-libspice-server1: 0.12.4-3
vncterm: 1.1-8
vzctl: 4.0-1pve6
vzprocps: 2.0.11-2
vzquota: 3.1-2
pve-qemu-kvm: 2.2-10
ksm-control-daemon: 1.1-1
glusterfs-client: 3.5.2-1
Código:
### /var/log/syslog
Jul 22 07:17:32 ns366256 kernel: device-mapper: snapshots: Invalidating snapshot: Unable to allocate exception.
Jul 22 07:17:33 ns366256 kernel: EXT4-fs error (device dm-0): ext4_find_entry: reading directory #26870325 offset 0
Jul 22 07:17:33 ns366256 kernel: __ratelimit: 138 callbacks suppressed
Jul 22 07:17:33 ns366256 kernel: Buffer I/O error on device dm-0, logical block 0
Jul 22 07:17:33 ns366256 kernel: lost page write due to I/O error on dm-0
Jul 22 07:17:33 ns366256 kernel: EXT4-fs error (device dm-0): ext4_find_entry: reading directory #26870325 offset 0
Jul 22 07:17:33 ns366256 kernel: EXT4-fs (dm-0): previous I/O error to superblock detected
Jul 22 07:17:33 ns366256 kernel: Buffer I/O error on device dm-0, logical block 0
Jul 22 07:17:33 ns366256 kernel: lost page write due to I/O error on dm-0
Jul 22 07:17:34 ns366256 kernel: EXT4-fs error (device dm-0): ext4_find_entry: reading directory #26870325 offset 0
Jul 22 07:17:34 ns366256 kernel: EXT4-fs (dm-0): previous I/O error to superblock detected
Jul 22 07:17:34 ns366256 kernel: Buffer I/O error on device dm-0, logical block 0
Jul 22 07:17:34 ns366256 kernel: lost page write due to I/O error on dm-0
Código:
### Backup Error Proxmox
INFO: Total bytes written: 82024960000 (77GiB, 3.3MiB/s)
INFO: tar: Exiting with failure status due to previous errors
ERROR: Backup of VM 103 failed - command '(cd /mnt/vzsnap0/private/103;find . '(' -regex '^\.$' ')' -o '(' -type 's' -prune ')' -o '(' -regex './var/lib/psa/dumps/.+' -prune ')' -o '(' -regex './var/lib/psa/dumps/.+' -prune ')' -o -print0|sed 's/\\/\\\\/g'|tar cpf - --totals --sparse --numeric-owner --no-recursion --one-file-system --null -T -|lzop) >/mnt/pve/nfs_daily/dump/vzdump-openvz-103-2015_07_22-00_30_07.tar.dat' failed: exit code 2
INFO: Backup job finished with errors
postdrop: warning: uid=0: File too large
Código:
### Scheduler sda y sdb
Deadline
Código:
### Pveperf
CPU BOGOMIPS: 56035.36
REGEX/SECOND: 1535793
HD SIZE: 9.49 GB (/dev/md2)
BUFFERED READS: 14.61 MB/sec
AVERAGE SEEK TIME: 226.70 ms
FSYNCS/SECOND: 2.65
DNS EXT: 40.46 ms
DNS INT: 5.29 ms
Código:
### dd if=/dev/zero of=/tmp/output conv=fdatasync bs=384k count=1k; rm -f /tmp/output
402653184 bytes (403 MB) copiados, 3,48669 s, 115 MB/s
Código:
### vgdisplay
VG Name pve
System ID
Format lvm2
Metadata Areas 1
Metadata Sequence No 958
VG Access read/write
VG Status resizable
MAX LV 0
Cur LV 1
Open LV 1
Max PV 0
Cur PV 1
Act PV 1
VG Size 985,24 GiB
PE Size 4,00 MiB
Total PE 252222
Alloc PE / Size 221695 / 866,00 GiB
Free PE / Size 30527 / 119,25 GiB
Adicionalmente mientras se realiza el backup, se realiza una sincronización mediante rsync y otra con lftp a distintos servidores de backups, para copiar webs, correos y bases de datos de forma incremental; pero como digo quiero poder realizar el snapshot completo.
Un saludo y gracias de antemano.