Informatique, Vie de tous les jours

Rendez-vous avec X

Pendant dix-huit ans France Inter a diffusé Rendez-vous avec X une émission documentaire sur l’histoire actuelle et contemporaine. Cette émission s’est arrêté en juin 2015 même si des rediffusions ont encore lieu (notamment cet été).

Télécharger l’intégralité (ou presque) des émissions

Un site  (non officiel…) regroupe la très grande majorité des émissions. Pour récupérer l’intégralité du site et consulter les fichiers dans son navigateur on peut simplement utiliser le programme wget. Les options -r pour avoir la récursivité et -c pour reprendre le téléchargement en cas d’échec sont retenues pour arriver à la commande wget -rc http://rendezvousavecmrx.free.fr/.

Après un certain temps (attention, c’est gros, très gros,…) le répertoire rendezvousavecmrx.free.fr contient l’intégralité du site web.

Trier et renommer les fichiers audio

Tel quel tout est en vrac, une moulinette Python avec BeautifulSoup permet de reprendre les fichiers MP3 et de les renommer proprement.

#!/usr/bin/env python
# coding=utf-8
import shutil
import bs4 as BeautifulSoup

rep = './rendezvousavecmrx.free.fr/'
fic_liste = open(rep+'page/liste.php')

html = fic_liste.read()
soup = BeautifulSoup.BeautifulSoup(html)

for tr in soup.findAll('tr'):
    a = tr.find('a')
    fichier = a.get('href')
    try:
      nom = a.find('img').get('alt')
      nom_fichier = fichier.split('/')[-1]
      print nom, rep+'audio/'+nom_fichier
      shutil.copyfile(rep+'audio/'+nom_fichier, nom.replace('/','-')+' - '+nom_fichier)
    except AttributeError as e:
      # Le fichier mp3 associé n'existe pas
      pass

fic_liste.close()

Améliorations

Les plus courageux pourront utiliser mutagen pour ajouter les tags MP3 au fichier. Perso, j’ai eu la flemme de le faire !

Enregistrer

Enregistrer

Enregistrer

Enregistrer

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *