Rendez-vous avec X
Pendant dix-huit ans France Inter a diffusé Rendez-vous avec X une émission documentaire sur l'histoire actuelle et contemporaine. Cette émission s'est arrêté en juin 2015 même si des rediffusions ont encore lieu (notamment cet été).
Télécharger l'intégralité (ou presque) des émissions
Un site (non officiel...) regroupe la très grande majorité des émissions. Pour récupérer l'intégralité du site et consulter les fichiers dans son navigateur on peut simplement utiliser le programme wget
. Les options -r
pour avoir la récursivité et -c
pour reprendre le téléchargement en cas d'échec sont retenues pour arriver à la commande wget -rc http://rendezvousavecmrx.free.fr/
.
Après un certain temps (attention, c'est gros, très gros,...) le répertoire rendezvousavecmrx.free.fr
contient l'intégralité du site web.
Trier et renommer les fichiers audio
Tel quel tout est en vrac, une moulinette Python avec BeautifulSoup permet de reprendre les fichiers MP3 et de les renommer proprement.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
#!/usr/bin/env python # coding=utf-8 import shutil import bs4 as BeautifulSoup rep = './rendezvousavecmrx.free.fr/' fic_liste = open(rep+'page/liste.php') html = fic_liste.read() soup = BeautifulSoup.BeautifulSoup(html) for tr in soup.findAll('tr'): a = tr.find('a') fichier = a.get('href') try: nom = a.find('img').get('alt') nom_fichier = fichier.split('/')[-1] print nom, rep+'audio/'+nom_fichier shutil.copyfile(rep+'audio/'+nom_fichier, nom.replace('/','-')+' - '+nom_fichier) except AttributeError as e: # Le fichier mp3 associé n'existe pas pass fic_liste.close() |
Améliorations
Les plus courageux pourront utiliser mutagen pour ajouter les tags MP3 au fichier. Perso, j'ai eu la flemme de le faire !
Laisser un commentaire