~bohwaz/blog/

Avec de vrais morceaux de 2.0 !

Télécharger les oeuvres de Google Art Project

Comme vous ne le savez peut-être pas, Google a rendu public le site
http://www.googleartproject.com/ qui permet d'observer de près une
partie de la collection de certains musées internationaux.

C'est très intéressant, on peut observer dans une résolution très
élevée des oeuvres comme si on pouvait regarder à la louper les oeuvres
au musée.

Cependant, alors que toutes ces oeuvres (à ma connaissance) sont partie
intégrante du domaine public, il n'est pas possible de télécharger les
images, on est obligés de passer par l'interface en Flash du site.
Alors que ces reproductions en très haute définition pourraient servir
à bien des choses, par exemple alimenter Wikimedia commons en
reproductions de qualité. Peut-être que cette impossibilité émane des
musées, effrayés à l'idée que des imprimeurs d'affiches/calendriers et
autres produits marketing ne soient plus obligés de passer par eux pour
obtenir une image haute définition ?

Peu importe la raison, voici un petit script PHP qui permet de
télécharger une oeuvre de Google Art Project au niveau de détail que
vous désirez (par défaut le niveau le plus élevé, qui varie selon les
oeuvres).

Comment procéder ?

  • Assurez-vous d'utiliser un Linux, d'avoir PHP en ligne de commande et ImageMagick d'installés (pour debian/ubuntu: apt-get install php5-cli imagemagick).
  • Téléchargez ou recopiez ce script sur votre ordinateur, par exemple sous le nom "gap_download.php" : http://bohwaz.net/static/gap-download.txt
  • Choisissez l'oeuvre que vous désirez télécharger sur Google Art Project.
  • Recopiez l'adresse de la page de l'oeuvre, par exemple http://www.googleartproject.com/museums/rijks/night-watch
  • Lancez le téléchargement avec le script dans un terminal :

$ php gap_download.php http://www.googleartproject.com/museums/rijks/night-watch

Le programme va procéder au téléchargement de toutes les parties de
l'image (qui est découpée en carrés de 512x512 pour des raisons
pratiques de leur interface en flash), puis recoller en une seule image.

Attention, l'image résultante peut se révéler assez grosse, selon la
résolution disponible de l'image.

Pour limiter le niveau de zoom à télécharger (et donc la résolution),
rajouter un espace suivi d'un chiffre après l'adresse de l'oeuvre, au
lancement de la commande. Attention, parfois l'image n'existe pas dans
le niveau de zoom demandé, elle est alors téléchargé au niveau maximum
(par exemple des photos ne sont disponibles qu'en niveau 1 ou 2).

Pour information en zoom 4 les images arrivent jusqu'à la taille de 5 à
6Mo.

Edit : trackback manuel de Korben.info.

Edit 2 : le script ne fonctionne plus suite à une mise à jour de Google. Voir ce billet pour plus de détails.

Écrire un commentaire
(facultatif)
(facultatif)
(obligatoire)
            _      
__   _____ (_)_ __ 
\ \ / / _ \| | '__|
 \ V / (_) | | |   
  \_/ \___/|_|_|   
                   
(obligatoire)

Les adresses internet seront converties automatiquement.
Tags autorisés : <blockquote> <cite> <pre> <code> <var> <strong> <em> <del> <ins> <kbd> <samp> <abbr>

temporalior

Très bonne initiative!

Deux questions

1) Est-ce que un site, ou un .torrent est prévu pour la diffusion des oeuvres téléchargées?

2) Y-a-t-il moyen de contribuer en étant sous Mac? En excluant une machine virtuelle ou une deuxième partition?

BohwaZ

Hello, j'ai toute l'archive en zoom 4 (2,5Go) mais je n'ai pas prévu de la partager, je saurais pas trop comment faire un torrent, mais si ça intéresse des gens je peux imaginer mettre ça à dispo sur un serveur en téléchargement oui.

Pour contribuer à Wikimedia Commons il suffit de choisir une oeuvre, de la télécharger et ensuite de l'envoyer sur Commons.

temporalior

Moi ça m'intéresserais beaucoup, je veux même bien en faire un torrent (uTorrent fait ça très facilement) si tu peux me la faire parvenir.

Je pense que c'est plus facile pour tout le monde de télécharger plutôt que de devoir tout enregistrer, surtout pour les gens qui ne sont pas sous Linux.

Merci pour Wikimedia Commons, je vais regarder ça.

BohwaZ

OK je vais regarder pour uploader une archive, mais avant ça faut déjà que je finisse de vérifier si les oeuvres sont bien dans le domaine public, j'ai un petit script pour ça aussi, mais il n'est pas parfait.

BohwaZ

Vérification terminée, je n'ai pas inclus les oeuvres d'artistes qui n'étaient pas dans le domaine public ou dont la date de décès n'est pas indiquée / trouvable facilement. Je me suis par contre rendu compte que ma compression JPEG était un peu trop forte, détruisant certaines images, j'ai donc augmenté la qualité et je suis en train de récupérer à nouveau toutes les images, mais c'est relativement long, compter une dizaine d'heures avant d'avoir terminé...

Yann

Bonjour et merci,

N'ayant linux que sur une clé usb, j'essaierai la méthode mais de manière ponctuelle. Je suis donc intéresse par le fait de pouvoir télécharger les œuvres libres dans la meilleure qualité possible

Bravo.

Yann

vasistas?

Google Art Project: Das nicht wirklich offene Museum

Mit dem am 1. Februar gestarteten Google Art Projekt können von nun an 2 Milliarden Internetnutzer die 17 bedeutendsten Kunstmuseen der Welt virtuell besuchen. In Deutschland haben sich die Gemäldegalerie und die Alten Nationalgalerie in Berlin an...

BohwaZ

Pour info, Dcoetzee va uploader les images en haute résolution au zoom maximum sur Wikimedia Commons : "I've already downloaded all the artworks at full resolution - the plan is to upload as high resolution as possible". Suivez http://commons.wikimedia.org/wiki/Category:Google_Art_Project pour voir les œuvres dispo.

Bon sinon l'archive est dispo : (merci d'utiliser le torrent) (2,6Go), elle contient l'ensemble des œuvres dans le domaine public, au zoom maximum 4 (résolution moyenne 3000x2000), soit 938 images.

Chaque image a en commentaire JPEG le nom de l'auteur et le titre de l'œuvre. Si vous souhaitez récupérer les infos de toutes les images, voici un fichier JSON qui a pour chaque nom de fichier le nom de l'auteur, le titre de l'oeuvre, le musée et l'identifiant Google Art correspondant, ainsi que l'année de décès de l'auteur : google-art-project-public-domain.json

panko

Ca a l'air très intéressant, mais le fichier source n'est plus disponible sur balbinus.org. Est-il possible de le publier de nouveau ou bien de placer le code ici ?

Merci beaucoup !