Skip to content

Ssyleric/pbs-Garbage-Collection-blocked

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 

Repository files navigation

🧹 Proxmox Backup Server – Résolution d'un blocage de Garbage Collection

🔍 Contexte

Le Garbage Collector (GC) de Proxmox Backup Server (PBS) était bloqué avec le message :

Error: marking used chunks failed: unexpected error on datastore traversal: Bad message (os error 74)

L'interface indiquait :

  • Pending Data: ~50 GiB
  • Impossible d’exĂ©cuter le GC
  • Échec silencieux de la planification, mĂŞme en forçant le job
  • Erreur Bad Request (400) lors de la modification via l’interface PBS Ă  cause d’un datastore.cfg mal interprĂ©tĂ© (ligne commentĂ©e non prise en compte).

⚒️ Cause identifiée

Une corruption partielle du système de fichiers sur le volume monté (/mnt/ssd4to) a empêché le GC d’accéder correctement aux chunks et index. Cela a causé :

  • Une lecture invalide des fichiers .fidx ou .didx
  • Des erreurs système type "Bad message"
  • Un GC bloquĂ© en phase 1 (mark used chunks)

✅ Solution appliquée

1. Mise en maintenance du datastore

proxmox-backup-manager datastore update marechal-pve --maintenance-mode offline

Ce mode empêche toute opération de lecture/écriture pendant les réparations.


2. ArrĂŞt des services PBS

systemctl stop proxmox-backup
systemctl stop nfs-server  # si utilisé

3. Vérification de l’utilisation du montage

lsof +f -- /mnt/ssd4to
fuser -vm /mnt/ssd4to

4. Démontage du volume

umount /mnt/ssd4to

5. Réparation du système de fichiers

fsck -f -v /dev/sdb1

✅ Plusieurs inodes optimisés, système de fichiers marqué comme modifié avec succès.


6. Remontage du volume

mount /mnt/ssd4to

Puis redémarrage de PBS :

systemctl start proxmox-backup

🔄 Nouvelle exécution du Garbage Collection

Le GC a été relancé avec succès :

proxmox-backup-client garbage-collect --repository marechal-pve

Résultat :

Removed garbage: 135.322 GiB
Removed chunks: 52204
Pending removals: 39.853 MiB
Leftover bad chunks: 2

🎉 Problème résolu — le Pending Data est retombé à ~40 MiB.


⚙️ Options de tuning recommandées

Depuis l’interface PBS > Datastore > Options :

Chunk Order: inode
Sync Level: filesystem
GC Access-Time Cutoff: 1445 (24h 5min)
GC Cache Capacity: 1048576

đź’ˇ Recommandations

  • Toujours exĂ©cuter un fsck si le GC Ă©choue de manière incomprĂ©hensible.
  • Surveiller la taille du Pending Data.
  • S’assurer que maintenance-mode est activĂ© avant toute rĂ©paration disque.
  • Ne pas commenter de lignes invalides dans /etc/proxmox-backup/datastore.cfg, elles causent un Bad Request.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published