Recadrer un document PDF multipage

Il s'agit ici de recadrer un document PDF multipage, par exemple pour réduire des marges démesurées, ou retirer les bandes noires apparues après la numérisation d'un document de petite taille. L'intérêt ? d'abord réduire le poids du fichier (qui contiendra de fait moins d'informations), ensuite pour faire de substantielles économies d'encre en cas d'impression, ou encore améliorer la lisibilité de ces documents sur petits écrans (téléphone, tablettes...). Voici trois méthodes acceptables dénichées au cours de mes pérégrinations, qui ont chacune leurs inconvénients et avantages.

Quelques précisions

Petite mise en garde pour commencer, notre objectif est ici de traiter en une fois toutes les pages de votre document PDF. Le principe est d'appliquer un seul jeu de paramètres à l'ensemble des pages, par conséquent, si votre document n'a pas été à chaque fois positionné à l'identique, alors les coupes ne se feront pas aux bons endroits [1].

Notons ensuite que si quelques outils de recadrage grand public existe [2], leur nature justifie cependant que l'on cherche des solutions alternatives. Tout d'abord parce qu'il ne s'agit pas véritablement de rognage mais plutôt de masquage [3], le document n'est de ce fait pas allégé des informations inutiles. Ensuite, ce recadrage virtuel n'est pas restitué la même manière selon le logiciel utilisé pour lire le document [4], provoquant des erreurs d'affichages problématiques si ce dernier a vocation à être partagé.

Utiliser TheGimp...

Voici une méthode (ici décrite notamment), qui concerne toutes les systèmes sur lesquels TheGimp fonctionne. L'avantage principale de cette solution est qu'elle seule autorise une sélection à la souris de la zone à garder. Par contre, c'est une méthode qui consomme énormément de ressources, rendant quasi-impossible le traitement de fichiers volumineux (à moins d'avoir une machine vraiment puissante et du temps devant soi).

Prérequis

  • TheGimp : pour l'installation, voyez sous Microsoft Windows cette page, ou celle-cii sous Mac OSX. Concernant GNU/Linux, reportez vous aux dépôts de votre distribution. Pour toute aide sur cette étape ce site francophone pourra vous être utile.
  • Imagemagick (ou GraphicsMagick) : sous Mac OSX et sous Microsoft Windows, rendez-vous à la page indiquée, téléchargez le programme et installez-le [5] ; sous GNU/Linux il est très probablement - sous forme de paquet - dans les dépôts de votre distribution.

Mode d'emploi

PNG - 321.4 ko
Recadrage avec l'outil de découpage
  1. Ouvrez le document PDF comme une image classique. Dans la fenêtre d'importation qui s'ouvre : vous choisissez (a priori) de sélectionner tout, et - important - aussi d'ouvrir les pages en tant que calque. Vous validez en laissant le reste tel quel.
  2. Choisissez l'outil de découpage (raccourcis clavier : Maj+C), et sélectionnez la zone utile. Validez en tapant Entrée, voici votre document recadré.
  3. Il est normal que vous ne voyez apparaître que la première page, les autres sont bien présentes en tant que calques non-visibles, et ont été découpées avec le reste du document. À ce sujet, n'oublions pas ce petit réglage sans quoi l'ordre des pages sera sur le résultat final en ordre inversé : dans le menu Calques puis Pile et choisissez Inverser l'ordre des calques.
  4. Enregistrer sous maintenant avec le nom de votre choix, à l'emplacement qui vous convient le mieux sous le format Animation MNG. En effet, si Gimp importer les documents PDF, il ne sait pas les exporter. Nous sommes donc obligés de bricoler pour préserver la forme PDF de notre fichier.
  5. Pour cela, nous utilisons l'outil Imagick (ou GraphicsMagick) dans un terminal :

convert document.mng document.pdf

Et voici pour cette première méthode.

... ou redistiller ...

La seconde méthode a pour avantage d'être la seule ne pas recourir à des outils en ligne de commande. Il s'agit ici de redistiller le document PDF, c'est-à-dire l'imprimer virtuellement sous de nouvelles dimensions. Classiquement, nous allons abandonner le format A4 pour un autre plus petit, la difficulté principale étant de choisir le format le plus adapté. Impossible pour moi de vous aider sur ce point autrement qu'en vous invitant à vous rendre sur cette page qui répertorie les formats à votre disposition.

Prérequis

  • Acrobat Reader (gratuit), quelque soit votre système d'exploitation [6]. Pour l'installation, sous Mac OSX et Microsoft Windows rendez vous sur cette page, et pour les utilisateurs de GNU/Linux vous trouverez probablement ce paquet dans les dépôts de votre distribution.

Mode d'emploi succinct

PNG - 119.3 ko
Réglage des paramètres d'impression
  1. Ouvrez le document PDF avec Acrobat Reader.
  2. Dans le menu Fichier puis Imprimer, cliquez sur le bouton Propriétés pour choisir le format de papier souhaité ;
  3. De retour dans la fenêtre d'impression, dans Mise à l'échelle choisissez Aucune ;
  4. Également, vérifier si l'option Rotation auto et centrage des pages doit être cochée (dépends de votre situation) ;
  5. Cochez aussi la case Imprimer dans un fichier et valider.
  6. Enfin dans la fenêtre de dialogue qui s'ouvre alors, indiquer le nom du nouveau document créé, et changez son extension .ps en .pdf.

Comme vous le remarquerez sur cette capture d'écran, cette méthode a pour défaut majeur d'exiger de votre document qu'il soit centré (ou éventuellement en haut à gauche). En effet, impossible d'ajuster la position du recadrage sur la page. De plus, elle souffre d'un manque de souplesse, puisqu'il est difficile de retoucher une marge au centimètre près, il faut se contenter des formats de papier définis par la norme ISO 216.

... ou via le terminal

Si cette méthode (décrite sur ici le forum de Framagora) peut paraître austère, c'est finalement la plus efficace à mes yeux. J'ai choisi de vous présenter ici PDFjam pour sa simplicité d'utilisation, mais le script python PDFCrop semble aussi tout à fait performant et à l'avantage d'être a priori utilisable sur toutes les plateformes.

Prérequis

  • PDFjam. Disponible dans les dépôts de la plupart des distributions GNU/Linux ; également utilisable sous Mac OSX, cette solution n'est par contre pas compatible avec Microsoft Windows [7] [8].

Mode d'emploi

Elle s'emploie avec la commande unique :

pdfnup --trim "2cm 2cm 2cm 2cm" --nup 1 source.pdf

Les marges de rognage (ici : 2cm sur les quatre cotés) sont à lire sur le modèle : "Gauche Bas Droite Haut". Bien sûr, vous devrez remplacer source.pdf par le nom de votre document, et éventuellement sa localisation dans l'arborescence.

Conclusion

Difficile finalement de trouver un mode d'emploi sur le web qui fasse état d'une méthode fiable, simple et efficace. Il n'existe pour ainsi dire, aujourd'hui et quelque soit le système d'exploitation, aucune solution idéale... à moins peut-être d'ouvrir son porte-monnaie.

D'un point de vue général sinon, ce petit état des lieux fut l'occasion de remarquer l'inégalité des outils disponibles pour le traitement des documents PDF selon les différents systèmes d'exploitation. Étonnamment, ce sont les plateformes GNU/Linux (et par extension Mac OSX en bénéficie aussi souvent) qui sont ici favorisés, on y trouve en effet une foule d'outils accessibles et performants (en ligne de commande souvent il est vrai). Je serais bien curieux d'en connaître la cause...


[1] Ce qui ne veut pas dire que c'est impossible à faire, ce n'est simplement pas le sujet ici. N'hésitez pas à utiliser les commentaires...

[2] Par exemple au sein du logiciel Adobe Acrobat, ou Aperçu de Mac OSX.

[3] Aucune donnée n'y est véritablement effacée, le retour en arrière est facile, ce qui peut constituer certes un avantage.

[4] Notamment sous Mac OSX, une incompatibilité reconnue existe en Aperçu et Adobe Acrobat (plusieurs décalages constatés).

[5] Vous trouverez sur cette page quelques indications qui auront leur importance en cas de problème d'installation sous Microsoft Windows

[6] D'autres outils existent bien sûr sur chacune d'entre elles : pour Mac OSX, Aperçu ; pour Microsoft Windows, PDFCreator). La procédure y est similaire.

[7] Sur cette plateforme, il devrait être possible d'imaginer un similaire avec l'outil ImageMagick, toujours en ligne de commande. Si ça intéresse quelqu'un, utilisez les commentaires, je devrais pouvoir expliquer...

[8] Une autre méthode est décrite sur cette page : Les mésaventure d'un PDF. Elle s'appuie également sur deux outils en ligne de commande, pdftops et pdfimages.

Illustration : Acme Self-Clamping Paper-Cutting Machine, American Encyclopaedia of Printing, edited by J. Luther Ringwalt (source).

Vus : 3160
Publié par archi02 : 28