-require 'rexml/document'\r
-require 'net/http'\r
-require 'thread'\r
-require 'thwait'\r
-require 'cgi'\r
-\r
-# G.Burri fait à l'arrache d'après : 'www.la-rache.com'\r
-\r
-#constantes\r
-FILMS_EXTENSIONS = ['avi', 'mkv', 'rmvb', 'ogm', 'divx']\r
-FICHIER_PATTERN = "<title> [<codec>] [<lang-audio>] [<lang-st>] [<team>]" # la structure d'un fichier\r
-LOAD_DATA = true # charge les informations depuis le web ?\r
-\r
-#le nombre de connexions simultanés sur le site de films\r
-NB_CONN_MAX = 20\r
-\r
-class Objet\r
- @@compteur = 0\r
- def initialize\r
- @id = @@compteur + 1\r
- @@compteur += 1 \r
- end\r
- \r
- def getXml\r
- #abstrait\r
- end\r
-end\r
-\r
-class Personne < Objet\r
- attr_reader :nom\r
-\r
- @@personnes = {}\r
- \r
- #ajoute une personne et la retourne\r
- def Personne::ajouter(nom)\r
- if nil == personne = @@personnes[nom]\r
- personne = Personne::new(nom)\r
- @@personnes[nom] = personne\r
- end\r
- personne\r
- end\r
- \r
- def initialize(nom)\r
- @nom = nom\r
- end\r
- \r
- def getXml\r
- \r
- end\r
-end\r
-\r
-class Genre < Objet\r
- attr_reader :nom\r
- \r
- @@genres = {}\r
- \r
- #ajoute un genre et le retourne\r
- def Genre::ajouter(nom) \r
- if nil == genre = @@genres[nom]\r
- genre = Genre::new(nom)\r
- @@genres[nom] = genre\r
- end\r
- genre\r
- end\r
- \r
- def initialize(nom)\r
- @nom = nom\r
- end\r
- \r
- def getXml\r
- \r
- end\r
+# coding: utf-8\r
+# YopYop est un super programme permettant de :\r
+# - Parcourir des dossiers recursivement à la recherche de fichier video\r
+# - Parser les fichiers afin d'en retirer les infos suivantes :\r
+# o le codec video\r
+# o le codec son\r
+# o les pistes audio\r
+# o les sous-titres disponible\r
+# - Les formats supportés :\r
+# o avi\r
+# o ogm\r
+# o mkv\r
+# o rmvb\r
+# - Rechercher chaque film sur le site 'allocine.com' et 'imdb.com' et en pomper un max d'infos\r
+# - Etablir une petit base de données des films au format xml\r
+\r
+require 'films.rb'\r
+require 'film.rb'\r
+\r
+require 'images.rb'\r
+\r
+# vérifie les arguments donnés\r
+$xmlFile = nil\r
+$repBase = Dir::getwd\r
+$repFilms = '.'\r
+$repAffichette = '../img/affichette/'\r
+mod = 'Allocine'\r
+purgeImages = false\r
+\r
+aPrec = ''\r
+$*.each{|a|\r
+ case a\r
+ when '-p'\r
+ purgeImages = true\r
+ next\r
+ end\r
+ case aPrec\r
+ when '-x'\r
+ $xmlFile = a\r
+ when '-d'\r
+ $repFilms = a\r
+ when '-m'\r
+ mod = a\r
+ when '-a'\r
+ $repAffichette = a\r
+ end \r
+ aPrec = a\r
+}\r
+\r
+if $xmlFile.nil?\r
+ puts USAGE\r
+ exit 0\r
end\r
\r
-class Pays < Objet\r
- attr_reader :nom\r
- \r
- @@pays = {}\r
- \r
- #ajoute un pays et le retourne\r
- def Pays::ajouter(nom)\r
- if nil == pays = @@pays[nom]\r
- pays = Pays::new(nom)\r
- @@pays[nom] = pays\r
- end\r
- pays \r
- end\r
- \r
- def initialize(nom)\r
- @nom = nom\r
- end\r
- \r
- def getXml\r
- \r
- end\r
+unless File::directory?($repFilms)\r
+ puts "'#{$repFilms}' is not a valid directory"\r
+ exit 1\r
end\r
\r
-class Film\r
- attr_accessor :titre, :fichier, :annee, :realisateurs, :acteurs, :pays, :duree, :critiquePresse, :critiqueSpectateur, :genres, :synopsis, :budget\r
- \r
- # les films indexés par leur titre\r
- @@films = {}\r
- #les films indexés par leur nom de fichier\r
- @@filmsFichier = {}\r
-\r
- @@mutex = Mutex::new\r
- @@threadsWait = ThreadsWait::new\r
- @@nbConn = 0\r
- \r
- def Film::litRepertoire(r)\r
- Film::litRepertoireR(r)\r
- #on attends que les threads se terminent\r
- @@threadsWait.all_waits\r
- end\r
- \r
- # Charge les films contenus dans un fichier XML.\r
- def Film::loadFilmsXml(xmlFile)\r
- racine = REXML::Document::new(File::new(xmlFile)).root\r
- racine.each_element{|e|\r
- fichier = e.get_elements('fichier')[0].get_text\r
- next if fichier == nil\r
- titre = e.get_elements('titre')[0].get_text\r
- annee = e.get_elements('annee')[0].get_text\r
- duree = e.get_elements('duree')[0].get_text\r
- critiquePresse = e.get_elements('critiquePresse')[0].get_text\r
- critiqueSpectateur = e.get_elements('critiqueSpectateur')[0].get_text\r
- synopsis = e.get_elements('synopsis')[0].get_text\r
- budget = e.get_elements('budget')[0].get_text \r
- realisateurs = e.get_elements('realisateur')\r
- acteurs = e.get_elements('acteur')\r
- pays = e.get_elements('pays')\r
- genres = e.get_elements('genres')\r
- \r
- \r
- film = Film::new(fichier.value)\r
- film.titre = titre.value unless titre.nil?\r
- film.annee = annee.value unless annee.nil?\r
- realisateurs.each{|e|\r
- film.realisateurs << Personne::ajouter(e.get_text.value)\r
- } \r
- acteurs.each{|e|\r
- film.acteurs << Personne::ajouter(e.get_text.value)\r
- }\r
- pays.each{|e|\r
- film.pays << Pays::ajouter(e.get_text.value)\r
- }\r
- film.duree = duree.value unless duree.nil?\r
- film.critiquePresse = critiquePresse.value unless critiquePresse.nil?\r
- film.critiqueSpectateur = critiqueSpectateur.value unless critiqueSpectateur.nil?\r
- genres.each{|e|\r
- film.genres << Genre::ajouter(e.get_text.value)\r
- }\r
- film.synopsis = synopsis.value unless synopsis.nil?\r
- film.budget = budget.value unless budget.nil?\r
- @@films[film.titre] = film\r
- @@filmsFichier[film.fichier] = film\r
- } \r
- end\r
- \r
- # Renvoie tous les films sous la forme d'un élement XML.\r
- def Film::getFilmsXml\r
- racine = REXML::Element::new('filmographie')\r
- @@films.each{|nom, f|\r
- racine.add(f.getXml)\r
- } \r
- return REXML::Document::new.add(racine)\r
- end\r
-\r
-private\r
- def Film::litRepertoireR(r)\r
- Dir::foreach(r){|f|\r
- next if f == '.' or f == '..'\r
- fichier = r + "/" + f\r
- if File::directory?(fichier)\r
- litRepertoireR(fichier) \r
- else\r
- \r
- #si le film n'existe pas déjà dans la liste\r
- if film = @@filmsFichier[fichier]\r
- puts "[i] Already exists in DB : #{film.titre} (#{film.fichier})"\r
- next\r
- end\r
- \r
- film = nil \r
- @@nbConn += 1 \r
- @@threadsWait.join_nowait(\r
- Thread::new{ \r
- begin\r
- @@mutex.lock if @@nbConn >= NB_CONN_MAX \r
- #p @@nbConn \r
- film = Film::filmsFactory(fichier)\r
- unless film.nil?\r
- if @@films.has_key?(film.titre)\r
- puts "[!] Duplicate movie : #{film.titre} (#{film.fichier})"\r
- else\r
- puts "[i] movie added : #{film.titre} (#{film.fichier})"\r
- @@films[film.titre] = film\r
- @@filmsFichier[film.fichier] = film\r
- end\r
- end\r
- @@nbConn -= 1\r
- #p @@nbConn\r
- @@mutex.unlock\r
- rescue Exception => e
- puts e.message
- puts e.backtrace\r
- end\r
- }\r
- )\r
- end\r
- }\r
- end\r
- \r
- def Film::filmsFactory(fichier)\r
- /^.*?\.(.{3,4})$/ =~ fichier\r
- if FILMS_EXTENSIONS.include?($1)\r
- Film::new(fichier).loadData\r
- end\r
- end\r
-\r
-public\r
-\r
- def initialize(fichier)\r
- @fichier = fichier\r
- @titre = ''\r
- @annee = nil\r
- @realisateurs = []\r
- @acteurs = []\r
- @pays = []\r
- @duree = nil\r
- @critiquePresse = nil\r
- @critiqueSpectateur = nil\r
- @genres = []\r
- @synopsis = nil\r
- @budget = nil \r
- @budgetUnite = 'euro'\r
- end\r
- \r
- #charge les informations du films à partir d'allocine\r
- def loadData\r
- unless LOAD_DATA\r
- @titre = @fichier\r
- return self\r
- end\r
-\r
- connexionHttp = Net::HTTP::new('www.allocine.fr');\r
- \r
- #extrait le nom à partire du nom du fichier\r
- /^.*?([^\/]*?)\.(.{3,4})$/ =~ @fichier\r
- #remplace undescores et points par des espaces\r
- titre = $1.gsub(/[_\.]/, ' ')\r
- #vire les espaces au début et à la fin\r
- titre.strip!\r
- #remplace les suites d'espaces par un seul\r
- titre.gsub!(/ {2,}/,' ')\r
- titre.gsub!(/\[.*?\]/,'')\r
- titre.gsub!(/\(.*?\)/,'')\r
- @titre = titre.dup\r
- \r
- donneesHtml = nil\r
- begin\r
- reponse, donneesHtml = connexionHttp.get("/recherche/?motcle=#{CGI::escape(titre)}")\r
- #si pas trouvé alors on enlève un mot à la fin\r
- if /.*?Pas de résultats.*?/ =~ donneesHtml\r
- /(.*?)[^ ]+?$/ =~ titre.strip\r
- titre = $1\r
- titre.strip!\r
- else\r
- break;\r
- end\r
- end while not titre.nil? and not titre.empty?\r
- \r
- unless titre.nil? or titre.empty?\r
- /<a href="\/film\/fichefilm_gen_cfilm=(\d+)\.html" class="link1">/ =~ donneesHtml\r
- if $1\r
- r, ficheHtml = connexionHttp.get("/film/fichefilm_gen_cfilm=#{$1}.html") \r
- \r
- # Titre\r
- /<title>(.*?)<\/title>/ =~ ficheHtml\r
- @titre = $1 unless $1.nil?\r
- \r
- #puts "Movie found : #{@titre} (#{@fichier})"\r
- \r
- # Année\r
- /<h4>Année de production : (\d+)<\/h4>/ =~ ficheHtml\r
- @annee = $1.to_i unless $1.nil? \r
- \r
- # Réalisateurs\r
- /Réalisé par <a class="link1" href=".*?" target="">(.*?)<\/a>/ =~ ficheHtml\r
- @realisateurs << Personne::ajouter($1) unless $1.nil?\r
- \r
- # Acteurs\r
- /Avec(.*)/ =~ ficheHtml\r
- $1.scan(/<a class="link1" href="\/personne\/fichepersonne_gen_cpersonne=\d+\.html" target="">(.+?)<\/a>/m){|a|\r
- @acteurs << Personne::ajouter(a[0]) unless a[0].nil? \r
- } unless $1.nil? \r
- \r
- # Pays\r
- /^<h4>Film (.*?)\.<\/h4>/ =~ ficheHtml\r
- $1.split(',').each{|pays|\r
- @pays << Pays::ajouter(pays) unless pays.nil?\r
- } unless $1.nil? \r
- \r
- # Duree\r
- /<h4>Durée : (\d+?)h (\d+?)min.<\/h4>/ =~ ficheHtml\r
- @duree = $1.nil? ? $2.to_i : $1.to_i * 60 + $2.to_i\r
- \r
- # Critique presse\r
- /Presse<\/a> <img src=".*?etoile_(\d)\.gif"/ =~ ficheHtml\r
- @critiquePresse = $1.to_i unless $1.nil?\r
- \r
- # Critique spectateur\r
- /Spectateurs<\/a> <img src=".*?etoile_(\d)\.gif"/ =~ ficheHtml\r
- @critiqueSpectateur = $1.to_i unless $1.nil?\r
- \r
- # Genre\r
- /Genre : (.*)/ =~ ficheHtml\r
- $1.scan(/<a href="\/film\/alaffiche_genre_gen_genre=.*?" class="link1">(.+?)<\/a>/m){|g|\r
- @genres << Genre::ajouter(g[0]) unless g[0].nil?\r
- } unless $1.nil? \r
- \r
- # Synopsis \r
- /Synopsis.*?<h4>(.+?)<\/h4>/m =~ ficheHtml\r
- @synopsis = $1 unless $1.nil?\r
- \r
- # Budget \r
- /Budget<\/b> : (.+?) millions d'euros<\/h4>/ =~ ficheHtml\r
- @budget = $1.to_i unless $1.nil?\r
- else \r
- puts "[!] Movie not found : #{@titre} (#{@fichier})"\r
- end\r
- end\r
- self\r
- end\r
- \r
- def getXml \r
- racine = REXML::Element::new('film')\r
- racine.add(REXML::Element::new('fichier').add_text(@fichier))\r
- racine.add(REXML::Element::new('titre').add_text(@titre))\r
- racine.add(REXML::Element::new('annee').add_text(@annee.to_s))\r
- \r
-\r
- @realisateurs.each{|r|\r
- racine.add(REXML::Element::new('realisateur').add_text(r.nom))\r
- }\r
- \r
- @acteurs.each{|a|\r
- racine.add(REXML::Element::new('acteur').add_text(a.nom))\r
- }\r
- @pays.each{|p|\r
- racine.add(REXML::Element::new('pays').add_text(p.nom))\r
- } \r
- racine.add(REXML::Element::new('duree').add_text(@duree.to_s))\r
-\r
- racine.add(REXML::Element::new('critiquePresse').add_text(@critiquePresse.to_s))\r
- racine.add(REXML::Element::new('critiqueSpectateur').add_text(@critiqueSpectateur.to_s))\r
- @genres.each{|g|\r
- racine.add(REXML::Element::new('genre').add_text(g.nom))\r
- } \r
- racine.add(REXML::Element::new('synopsis').add_text(@synopsis))\r
- budgetElement = REXML::Element::new('budget')\r
- budgetElement.add_text(@budget.to_s)\r
- budgetElement.add_attribute('unite', @budgetUnite)\r
- racine.add(budgetElement)\r
-\r
- racine\r
- end\r
+begin\r
+ require "modules/#{mod}"\r
+rescue\r
+ puts "Le module '#{mode}' n'existe pas. Les modules se trouvent dans le dossier 'src/modules'"\r
+ puts USAGE\r
+ exit 1\r
end\r
\r
+# charge les films à partir du fichier xml\r
+films = Films::new($xmlFile, Module.class_eval(mod))\r
\r
-rep = '.'\r
-if $*.empty?\r
- puts 'USAGE : <xml file> [<directory>]'\r
- exit 0\r
-elsif $*.size == 1\r
- puts 'no directory given, use the current'\r
+if purgeImages\r
+ Images.nettoyer(films, $repAffichette)\r
else\r
- rep = $*[1]\r
-end\r
-xmlFile = $*[0]\r
+ # parcours le dossier donné et recherche les infos sur le net\r
+ films.pomper($repFilms)\r
\r
-unless File::directory?(rep)\r
- puts "'#{rep}' is not a valid directory"\r
- exit 1\r
+ # écrit le fichier XML\r
+ films.sauverFilms()\r
end\r
-\r
-# charge les films à partir du fichier xml\r
-Film::loadFilmsXml(xmlFile)\r
-\r
-# lit le repertoire\r
-Film::litRepertoire(rep)\r
-\r
-# ecrit le fichier XML\r
-Film::getFilmsXml.write(File::new(xmlFile, 'w'))\r