fdupes pour supprimer les doublons

tux!! EDIT !!

En raison d’un bug sur les images de mon blog, j’ai voulu verrouiller ce post pour fixer les images, je pensais que les posts protégés par mot de passe n’étaient pas envoyés dans les flux, malheureusement si, c’est la raison pour laquelle certains d’entre vous sont tombés sur ce billet, je m’excuse pour le désagrément, à l’avenir je mettrai les tags à la fin pour éviter que cela se reproduise. Bonne lecture.

!!FIN!!

J’ai beaucoup de documentation sur mon ordinateur et j’ai un gros problème à cause des doublons, au début j’étais parti pour faire une recherche manuelle, mais mon stagiaire actuel (Encore meric Damien ;) ) m’a dit de faire un tri des doublons grâce aux md5sum des fichiers. Je me suis donc lancé dans une bonne commande à l’aide de l’ami find et lors d’une recherche sur l’ami google je tombe sur le man du packet fdupes, qui réalise exactement ce que je veux.

Pour Ubuntu et Debian c’est comme d’abitude : sudo aptitude install fdupes

Une fois installé l’utilisation est extremement facile.

$fdupes /mon_repertoire/

l’option -d propose de garder un des fichiers et supprimer les doublons.

Alors, pour l’exemple j’ai pris le chapitre 1 du très bon livre « Simple comme Ubuntu »  et l’excellent pdf sur l’installation de débian et j’ai créé 2 doublons des deux, j’ai rajouté un simple fichier texte en plus

Donc voici le contenu du dossier

Dossier avec doublon

Dossier avec les doublons

Maintenant un petit coup de md5sum pour constater que l’on a bien 2 doublons des deux pdf (for i in `ls`;do md5sum $i;done)

Le md5sum

Le md5sum des fichiers

Maintenant on lance fdupes et on constate qu’il nous affiche bien les doublons

Affichage des doublons

Affichage des doublons

On lance fdupes . -d pour avoir la suppression

Suppression finie

Suppression finie

Une fois les fichiers supprimés voici notre dossier débarrassé des fichiers dupliqués ou l’on retrouve le fichier texte qui lui n’avait aucun doublon.

Plus de doublons

Plus de doublons

Vus : 966
Publié par Macsim : 22