~bohwaz/blog/

Avec de vrais morceaux de 2.0 !

Scanner et archiver ses papiers

Il y a certains papiers qu'il est utile d'archiver (et sauvegarder/répliquer !) électroniquement, typiquement les fiches de paie, les factures de produits de valeurs, les notices et manuels de produits, etc. Et le mieux pour l'archivage, c'est le PDF non ? Mais bon c'est un peu fastidieux de scanner des dizaines de documents dans un logiciel graphique pas vraiment prévu pour, faut faire plein de clics, et ne parlons même pas de la transformation en PDF. La solution ? COmme d'habitude c'est la ligne de commande, oui cette bonne vieille CLI, si décriée, si haïe par les fanboys apple et windows, est pourtant l'outil le plus simple et le plus puissant à notre disposition !

Pour commencer il vous faut évidemment un scanner configuré et fonctionnel et avoir installé les packages sane-utils et imagemagick.

Scanner une page

Ici nous scannons en 150 dpi :

$ scanimage -v -p --resolution 150 > scan.pnm

OK on a maintenant une image au format PNM. Cool mais bon c'est pas vraiment un format très reconnu ni répandu, et pour l'archivage ça prends beaucoup de place vu que c'est une compression sans perte. On va donc le passer en Jpeg :

$ convert scan.pnm scan.jpg

Convertir en PDF

$ convert scan.jpg scan.pdf

Et oui c'est aussi simple que ça. Et mettre plusieurs pages dans le PDF ? Aussi simple :

$ convert scan1.jpg scan2.jpg scan3.jpg scan.pdf

Archivage assisté

Maintenant ça serait bien d'automatiser tout ça grâce à un beau script bash que voici, à recopier dans un fichier sans oublier ensuite de faire un chmod +x sur ce fichier.

Écrire un commentaire
(facultatif)
(facultatif)
(obligatoire)
           _            
 _ __ ___ (_)_ __   ___ 
| '_ ` _ \| | '_ \ / _ \
| | | | | | | | | |  __/
|_| |_| |_|_|_| |_|\___|
                        
(obligatoire)

Les adresses internet seront converties automatiquement.
Tags autorisés : <blockquote> <cite> <pre> <code> <var> <strong> <em> <del> <ins> <kbd> <samp> <abbr>

sebsauvage

D'habitude j'archive plutôt en noir & blanc 360dpi (et non niveaux de gris), le tout enregistré en TIFF CCITT groupe 4, ce qui donne des fichiers remarquablement petits (entre 50 et 100ko par page A4), avec une excellente lisibilité à l'impression.

N&B car c'est uniquement le texte qui m'intéresse.

360dpi pour avoir une excellente lisibilité à l'impression, même avec les petits textes.

Julien

Merci beaucoup! Dans le genre commande "sauve_la_vie", celle là est bien placée !

@Sebsauvage

Donc si j'ai bien compris:

scanimage -v -p --resolution 360 -icc-profile 4 --format=tiff image.tiff

La commande est-elle bonne ? (Le noir&blanc est bien contenu dans le paramètre icc-profile 4 ?)

BohwaZ

@Julien : la commande noir et blanc dépends de ton scanner, regarde scanimage --help pour savoir c'est quoi. Sinon scanimage ne sait pas faire du TIFF CCITT groupe 4 à ma connaissance (ICC c'est autre chose), il faudrait faire ça :

$ scanimage --mode "Black and white" --resolution 360 -v -p --format tiff > image.tiff
$ convert -type bilevel -monochrome -compress group4 image.tiff image.tiff

Mais perso j'obtiens des fichiers de 1Mo, et de toutes façons mes fiches de paie sont en couleur (avec des grands dégradés verts), donc en noir et blanc c'est illisible, je reste donc sur le JPEG en PDF.

sebsauvage

Je ne suis pas sûr pour le --icc-profile=4 (Je ne suis pas sur mon PC avec scanner, là, je ne peux pas vérifier).

Par contre je crois qu'il faut mettre --mode Lineart pour faire du noir & blanc.

Je ne pense pas que scanimage supporte nativement le TIFF CCIT group 4.

BohwaZ

@sebsauvage : le --mode dépend du scanner (hélas), genre chez moi :

--mode Black and White - Line Art|Grayscale - 256 Levels|Color - 16 Million Colors [Color - 16 Million Colors]

Julien

Merci BohwaZ et Sebsauvage pour les commandes, je colle tout ça dans un bout de fichier texte.

J'ai tout testé et malheureusement ma nouvelle imprimante de la mort ne gère pas grand chose. Elle m'a couté moins cher que le pris des cartouches d'encre c'est pour dire ! Et les couleurs ne sont pas séparées... Je crois que je vais la donner (à un pauvre malheureux qui n'aura pas beaucoup de chance...) et m'en trouver une un peu plus vielle.

Xib

Bonjour,

C'est bien beau de nous parler de code ou de je ne sais trop quelles lignes de commandes mais en pratique quand on y connait rien on fait comment ?..On va ou ?..On écrit ça ou ?..C'est vraiment que pour les initiés ?.. Merci pour ce blog traité avec beaucoup d'humanité (surtout le passage sur le pôle emploi)