Télécharger les oeuvres de Google Art Project
Comme vous ne le savez peut-être pas, Google a rendu public le site
http://www.googleartproject.com/ qui permet d'observer de près une
partie de la collection de certains musées internationaux.
C'est très intéressant, on peut observer dans une résolution très
élevée des oeuvres comme si on pouvait regarder à la louper les oeuvres
au musée.
Cependant, alors que toutes ces oeuvres (à ma connaissance) sont partie
intégrante du domaine public, il n'est pas possible de télécharger les
images, on est obligés de passer par l'interface en Flash du site.
Alors que ces reproductions en très haute définition pourraient servir
à bien des choses, par exemple alimenter Wikimedia commons en
reproductions de qualité. Peut-être que cette impossibilité émane des
musées, effrayés à l'idée que des imprimeurs d'affiches/calendriers et
autres produits marketing ne soient plus obligés de passer par eux pour
obtenir une image haute définition ?
Peu importe la raison, voici un petit script PHP qui permet de
télécharger une oeuvre de Google Art Project au niveau de détail que
vous désirez (par défaut le niveau le plus élevé, qui varie selon les
oeuvres).
Comment procéder ?
- Assurez-vous d'utiliser un Linux, d'avoir PHP en ligne de commande et ImageMagick d'installés (pour debian/ubuntu: apt-get install php5-cli imagemagick).
- Téléchargez ou recopiez ce script sur votre ordinateur, par exemple sous le nom "gap_download.php" : http://bohwaz.net/static/gap-download.txt
- Choisissez l'oeuvre que vous désirez télécharger sur Google Art Project.
- Recopiez l'adresse de la page de l'oeuvre, par exemple http://www.googleartproject.com/museums/rijks/night-watch
- Lancez le téléchargement avec le script dans un terminal :
$ php gap_download.php http://www.googleartproject.com/museums/rijks/night-watch
Le programme va procéder au téléchargement de toutes les parties de
l'image (qui est découpée en carrés de 512x512 pour des raisons
pratiques de leur interface en flash), puis recoller en une seule image.
Attention, l'image résultante peut se révéler assez grosse, selon la
résolution disponible de l'image.
Pour limiter le niveau de zoom à télécharger (et donc la résolution),
rajouter un espace suivi d'un chiffre après l'adresse de l'oeuvre, au
lancement de la commande. Attention, parfois l'image n'existe pas dans
le niveau de zoom demandé, elle est alors téléchargé au niveau maximum
(par exemple des photos ne sont disponibles qu'en niveau 1 ou 2).
Pour information en zoom 4 les images arrivent jusqu'à la taille de 5 à
6Mo.
Edit : trackback manuel de Korben.info.
Edit 2 : le script ne fonctionne plus suite à une mise à jour de Google. Voir ce billet pour plus de détails.
temporalior
Très bonne initiative!
Deux questions
1) Est-ce que un site, ou un .torrent est prévu pour la diffusion des oeuvres téléchargées?
2) Y-a-t-il moyen de contribuer en étant sous Mac? En excluant une machine virtuelle ou une deuxième partition?
BohwaZ
Hello, j'ai toute l'archive en zoom 4 (2,5Go) mais je n'ai pas prévu de la partager, je saurais pas trop comment faire un torrent, mais si ça intéresse des gens je peux imaginer mettre ça à dispo sur un serveur en téléchargement oui.
Pour contribuer à Wikimedia Commons il suffit de choisir une oeuvre, de la télécharger et ensuite de l'envoyer sur Commons.
temporalior
Moi ça m'intéresserais beaucoup, je veux même bien en faire un torrent (uTorrent fait ça très facilement) si tu peux me la faire parvenir.
Je pense que c'est plus facile pour tout le monde de télécharger plutôt que de devoir tout enregistrer, surtout pour les gens qui ne sont pas sous Linux.
Merci pour Wikimedia Commons, je vais regarder ça.
BohwaZ
OK je vais regarder pour uploader une archive, mais avant ça faut déjà que je finisse de vérifier si les oeuvres sont bien dans le domaine public, j'ai un petit script pour ça aussi, mais il n'est pas parfait.
temporalior
D'accord, si tu as besoin d'aide pour faire quelques vérifications à la main, je suis là!
BohwaZ
Vérification terminée, je n'ai pas inclus les oeuvres d'artistes qui n'étaient pas dans le domaine public ou dont la date de décès n'est pas indiquée / trouvable facilement. Je me suis par contre rendu compte que ma compression JPEG était un peu trop forte, détruisant certaines images, j'ai donc augmenté la qualité et je suis en train de récupérer à nouveau toutes les images, mais c'est relativement long, compter une dizaine d'heures avant d'avoir terminé...
temporalior
D'accord, je me tiendrais au courant demain alors!
Merci beaucoup!
temet.nosce
salut BohwaZ , est ce que tu compte faire une version zindowz ^^ ?
Yann
Bonjour et merci,
N'ayant linux que sur une clé usb, j'essaierai la méthode mais de manière ponctuelle. Je suis donc intéresse par le fait de pouvoir télécharger les œuvres libres dans la meilleure qualité possible
Bravo.
Yann
vasistas?
Google Art Project: Das nicht wirklich offene Museum
Mit dem am 1. Februar gestarteten Google Art Projekt können von nun an 2 Milliarden Internetnutzer die 17 bedeutendsten Kunstmuseen der Welt virtuell besuchen. In Deutschland haben sich die Gemäldegalerie und die Alten Nationalgalerie in Berlin an...
temporalior
Je m'occuperais de faire un .torrent que je diffuserais
Encore merci
paume
merci pour ce script qui fonctionne également avec Mac OS X après avoir installé ImageMagick (Macport ou Fink)
temporalior
Il marche avec Mac OS X? Ca m'intéresse beaucoup, je vais essayer de ce pas.
temporalior
Bon j'arrive pas sur Mac OS, j'attendrais l'archive de Bohwaz plutot
BohwaZ
Pour info, Dcoetzee va uploader les images en haute résolution au zoom maximum sur Wikimedia Commons : "I've already downloaded all the artworks at full resolution - the plan is to upload as high resolution as possible". Suivez http://commons.wikimedia.org/wiki/Category:Google_Art_Project pour voir les œuvres dispo.
Bon sinon l'archive est dispo : (merci d'utiliser le torrent) (2,6Go), elle contient l'ensemble des œuvres dans le domaine public, au zoom maximum 4 (résolution moyenne 3000x2000), soit 938 images.
Chaque image a en commentaire JPEG le nom de l'auteur et le titre de l'œuvre. Si vous souhaitez récupérer les infos de toutes les images, voici un fichier JSON qui a pour chaque nom de fichier le nom de l'auteur, le titre de l'oeuvre, le musée et l'identifiant Google Art correspondant, ainsi que l'année de décès de l'auteur : google-art-project-public-domain.json
Yann
Merci
temporalior
Merci beaucoup, pour ceux que ça interesse, un torrent sera disponible sur everymac.wordpress.com dans la journée
BohwaZ
J'attends le torrent pour seeder ;)
temporalior
Et voilà, la torrent est téléchargeable ici: bit.ly/eLq0HI
Je compte seeder un petit bout de temps, n'hésitez pas à faire de même!
Encore merci à toi BohwaZ :)
BohwaZ
OK, je seede (enfin si ça marche), merci :)
gio
Google semble bien aimer ce qui est propriétaire. :)
BohwaZ
Je retire l'archive en téléchargement direct, utilisez le torrent, merci, oh et déjà 100Go de seedé ;)
temporalior
Je continuerais de seeder sans discontinuer plusieurs semaines, essayer de tous faire de même, au moins quelques jours! :)
rike
Très très bonne initiative :)
Y a t-il eu des retours de la part de Google à ce sujet par ailleurs ?
PS : Dur ta validation pour les gens pas geek !
BohwaZ
Non pas de retour de Google, et pour la validation il suffit de recopier la question dans Google...
panko
Ca a l'air très intéressant, mais le fichier source n'est plus disponible sur balbinus.org. Est-il possible de le publier de nouveau ou bien de placer le code ici ?
Merci beaucoup !
BohwaZ
Voilà : http://bohwaz.net/static/gap-download.txt
panko
Merci beaucoup !
keefer
hi installed everything get error line 58 !
Yves
Bonjour, existe t'il une autre solution aujourd'hui vu que le script n'est plus téléchargeable ?