MOD Restructuration des sources
authorpifou <pifou@02bbb61a-6d21-0410-aba0-cb053bdfd66a>
Sat, 4 Nov 2006 16:44:46 +0000 (16:44 +0000)
committerpifou <pifou@02bbb61a-6d21-0410-aba0-cb053bdfd66a>
Sat, 4 Nov 2006 16:44:46 +0000 (16:44 +0000)
git-svn-id: svn://euphorik.ch/pompage@2 02bbb61a-6d21-0410-aba0-cb053bdfd66a

src/constantes.rb [new file with mode: 0644]
src/film.rb [new file with mode: 0644]
src/genre.rb [new file with mode: 0644]
src/objet.rb [new file with mode: 0644]
src/pays.rb [new file with mode: 0644]
src/personne.rb [new file with mode: 0644]
src/yopyop.rb

diff --git a/src/constantes.rb b/src/constantes.rb
new file mode 100644 (file)
index 0000000..00b912b
--- /dev/null
@@ -0,0 +1,8 @@
+\r
+#constantes\r
+FILMS_EXTENSIONS = ['avi', 'mkv', 'rmvb', 'ogm', 'divx']\r
+FICHIER_PATTERN = "<title> [<codec>] [<lang-audio>] [<lang-st>] [<team>]" # la structure d'un fichier\r
+LOAD_DATA = true # charge les informations depuis le web ?\r
+\r
+#le nombre de connexions simultanés sur le site de films\r
+NB_CONN_MAX = 20
\ No newline at end of file
diff --git a/src/film.rb b/src/film.rb
new file mode 100644 (file)
index 0000000..b795841
--- /dev/null
@@ -0,0 +1,292 @@
+require 'rexml/document'\r
+require 'net/http'\r
+require 'thread'\r
+require 'thwait'\r
+require 'cgi'\r
+\r
+require 'pays.rb'\r
+require 'genre.rb'\r
+require 'personne.rb'\r
+\r
+require 'constantes.rb'\r
+\r
+class Film\r
+   attr_accessor :titre, :fichier, :annee, :realisateurs, :acteurs, :pays, :duree, :critiquePresse, :critiqueSpectateur, :genres, :synopsis, :budget\r
+      \r
+   # Les films indexés par leur titre\r
+   @@films = {}\r
+   \r
+   # Les films indexés par leur nom de fichier\r
+   @@filmsFichier = {}\r
+\r
+   @@mutex = Mutex::new\r
+   @@threadsWait = ThreadsWait::new\r
+   @@nbConn = 0\r
+\r
+\r
+   # Lit un repertoire de manière recursive\r
+   def Film::litRepertoire(r)\r
+      Film::litRepertoireR(r)\r
+      # on attends que les threads se terminent\r
+      @@threadsWait.all_waits\r
+   end\r
+   \r
+   # Charge les films contenus dans un fichier XML.\r
+   def Film::loadFilmsXml(xmlFile)\r
+      # si le fichier n'existe pas il n'y a rien à charger\r
+      if !File.exists?(xmlFile)\r
+         return\r
+      end\r
+            \r
+      racine = REXML::Document::new(File::new(xmlFile)).root\r
+      racine.each_element{|e|\r
+         fichier = e.get_elements('fichier')[0].get_text\r
+         next if fichier == nil\r
+         titre = e.get_elements('titre')[0].get_text\r
+         annee = e.get_elements('annee')[0].get_text\r
+         duree = e.get_elements('duree')[0].get_text\r
+         critiquePresse = e.get_elements('critiquePresse')[0].get_text\r
+         critiqueSpectateur = e.get_elements('critiqueSpectateur')[0].get_text\r
+         synopsis = e.get_elements('synopsis')[0].get_text\r
+         budget = e.get_elements('budget')[0].get_text  \r
+         realisateurs = e.get_elements('realisateur')\r
+         acteurs = e.get_elements('acteur')\r
+         pays = e.get_elements('pays')\r
+         genres = e.get_elements('genres')\r
+         \r
+      \r
+         film = Film::new(fichier.value)\r
+         film.titre = titre.value unless titre.nil?\r
+         film.annee = annee.value unless annee.nil?\r
+         realisateurs.each{|e|\r
+            film.realisateurs << Personne::ajouter(e.get_text.value)\r
+         }        \r
+         acteurs.each{|e|\r
+            film.acteurs << Personne::ajouter(e.get_text.value)\r
+         }\r
+         pays.each{|e|\r
+            film.pays << Pays::ajouter(e.get_text.value)\r
+         }\r
+         film.duree = duree.value unless duree.nil?\r
+         film.critiquePresse = critiquePresse.value unless critiquePresse.nil?\r
+         film.critiqueSpectateur = critiqueSpectateur.value unless critiqueSpectateur.nil?\r
+         genres.each{|e|\r
+            film.genres << Genre::ajouter(e.get_text.value)\r
+         }\r
+         film.synopsis = synopsis.value unless synopsis.nil?\r
+         film.budget = budget.value unless budget.nil?\r
+         @@films[film.titre] = film\r
+         @@filmsFichier[film.fichier] = film\r
+      }   \r
+   end\r
+\r
+   # Renvoie tous les films sous la forme d'un élement XML.\r
+   def Film::getFilmsXml\r
+      racine = REXML::Element::new('filmographie')\r
+      @@films.each{|nom, f|\r
+         racine.add(f.getXml)\r
+      }\r
+      return REXML::Document::new.add(racine)\r
+   end\r
+   \r
+private\r
+\r
+   def Film::filmsFactory(fichier)\r
+      /^.*?\.(.{3,4})$/ =~ fichier\r
+      if FILMS_EXTENSIONS.include?($1)\r
+         Film::new(fichier).loadData\r
+      end\r
+    end\r
+    \r
+   def Film::litRepertoireR(r)\r
+      Dir::foreach(r){|f|\r
+         next if f == '.' or f == '..'\r
+         fichier = r + "/" + f\r
+         if File::directory?(fichier)\r
+            litRepertoireR(fichier) \r
+         else\r
+         \r
+            #si le film n'existe pas déjà dans la liste\r
+            if film = @@filmsFichier[fichier]\r
+               puts "[i] Already exists in DB : #{film.titre} (#{film.fichier})"\r
+               next\r
+            end\r
+            \r
+            film = nil   \r
+            @@nbConn += 1    \r
+            @@threadsWait.join_nowait(\r
+               Thread::new{    \r
+                  begin\r
+                     @@mutex.lock if @@nbConn >= NB_CONN_MAX                     \r
+                     #p @@nbConn     \r
+                     film = Film::filmsFactory(fichier)\r
+                     unless film.nil?\r
+                        if @@films.has_key?(film.titre)\r
+                           puts "[!] Duplicate movie : #{film.titre} (#{film.fichier})"\r
+                        else\r
+                           puts "[i] movie added : #{film.titre} (#{film.fichier})"\r
+                           @@films[film.titre] = film\r
+                           @@filmsFichier[film.fichier] = film\r
+                        end\r
+                     end\r
+                     @@nbConn -= 1\r
+                     #p @@nbConn\r
+                     @@mutex.unlock\r
+                  rescue  Exception => e\r
+                     puts e.message\r
+                     puts e.backtrace\r
+                  end\r
+               }\r
+            )\r
+         end\r
+      }\r
+    end\r
+\r
+   \r
+   def initialize(fichier)\r
+      @fichier = fichier\r
+      @titre = ''\r
+      @annee = nil\r
+      @realisateurs = []\r
+      @acteurs = []\r
+      @pays = []\r
+      @duree = nil\r
+      @critiquePresse = nil\r
+      @critiqueSpectateur = nil\r
+      @genres = []\r
+      @synopsis = nil\r
+      @budget = nil      \r
+      @budgetUnite = 'euro'\r
+   end\r
+\r
+public \r
+   #charge les informations du films à partir d'allocine.fr\r
+   def loadData\r
+      unless LOAD_DATA\r
+         @titre = @fichier\r
+         return self\r
+      end\r
+\r
+      connexionHttp = Net::HTTP::new('www.allocine.fr');\r
+   \r
+      #extrait le nom à partire du nom du fichier\r
+      /^.*?([^\/]*?)\.(.{3,4})$/ =~ @fichier\r
+      #remplace undescores et points par des espaces\r
+      titre = $1.gsub(/[_\.]/, ' ')\r
+      #vire les espaces au début et à la fin\r
+      titre.strip!\r
+      #remplace les suites d'espaces par un seul\r
+      titre.gsub!(/ {2,}/,' ')\r
+      titre.gsub!(/\[.*?\]/,'')\r
+      titre.gsub!(/\(.*?\)/,'')\r
+      @titre = titre.dup\r
+      \r
+      donneesHtml = nil\r
+      begin\r
+         reponse, donneesHtml = connexionHttp.get("/recherche/?motcle=#{CGI::escape(titre)}")\r
+         #si pas trouvé alors on enlève un mot à la fin\r
+         if /.*?Pas de résultats.*?/ =~ donneesHtml\r
+            /(.*?)[^ ]+?$/ =~ titre.strip\r
+            titre = $1\r
+            titre.strip!\r
+         else\r
+            break;\r
+         end\r
+      end while not titre.nil? and not titre.empty?\r
+      \r
+      unless titre.nil? or titre.empty?\r
+         /<a href="\/film\/fichefilm_gen_cfilm=(\d+)\.html" class="link1">/ =~ donneesHtml\r
+         if $1\r
+            r, ficheHtml = connexionHttp.get("/film/fichefilm_gen_cfilm=#{$1}.html")      \r
+            \r
+            # Titre\r
+            /<title>(.*?)<\/title>/ =~ ficheHtml\r
+            @titre = $1 unless $1.nil?\r
+            \r
+            #puts "Movie found : #{@titre} (#{@fichier})"\r
+            \r
+            # Année\r
+            /<h4>Année de production : (\d+)<\/h4>/ =~ ficheHtml\r
+            @annee = $1.to_i unless $1.nil?     \r
+            \r
+            # Réalisateurs\r
+            /Réalisé par <a class="link1" href=".*?" target="">(.*?)<\/a>/ =~ ficheHtml\r
+            @realisateurs << Personne::ajouter($1) unless $1.nil?\r
+                        \r
+            # Acteurs\r
+            /Avec(.*)/ =~ ficheHtml\r
+            $1.scan(/<a class="link1" href="\/personne\/fichepersonne_gen_cpersonne=\d+\.html" target="">(.+?)<\/a>/m){|a|\r
+               @acteurs << Personne::ajouter(a[0]) unless a[0].nil? \r
+            } unless $1.nil?     \r
+                      \r
+            # Pays\r
+            /^<h4>Film (.*?)\.<\/h4>/ =~ ficheHtml\r
+            $1.split(',').each{|pays|\r
+               @pays << Pays::ajouter(pays) unless pays.nil?\r
+            } unless $1.nil? \r
+            \r
+            # Duree\r
+            /<h4>Durée : (\d+?)h (\d+?)min.<\/h4>/ =~ ficheHtml\r
+            @duree = $1.nil? ? $2.to_i : $1.to_i * 60 + $2.to_i\r
+            \r
+            # Critique presse\r
+            /Presse<\/a> <img src=".*?etoile_(\d)\.gif"/ =~ ficheHtml\r
+            @critiquePresse = $1.to_i unless $1.nil?\r
+                                    \r
+            # Critique spectateur\r
+            /Spectateurs<\/a> <img src=".*?etoile_(\d)\.gif"/ =~ ficheHtml\r
+            @critiqueSpectateur = $1.to_i unless $1.nil?\r
+            \r
+            # Genre\r
+            /Genre : (.*)/ =~ ficheHtml\r
+            $1.scan(/<a href="\/film\/alaffiche_genre_gen_genre=.*?" class="link1">(.+?)<\/a>/m){|g|\r
+               @genres << Genre::ajouter(g[0]) unless g[0].nil?\r
+            } unless $1.nil?     \r
+            \r
+            # Synopsis            \r
+            /Synopsis.*?<h4>(.+?)<\/h4>/m =~ ficheHtml\r
+            @synopsis = $1 unless $1.nil?\r
+            \r
+            # Budget       \r
+            /Budget<\/b> : (.+?) millions d'euros<\/h4>/ =~ ficheHtml\r
+            @budget = $1.to_i unless $1.nil?\r
+         else         \r
+            puts "[!] Movie not found : #{@titre} (#{@fichier})"\r
+         end\r
+      end\r
+      self\r
+   end\r
+   \r
+   def getXml   \r
+      racine = REXML::Element::new('film')\r
+      racine.add(REXML::Element::new('fichier').add_text(@fichier))\r
+      racine.add(REXML::Element::new('titre').add_text(@titre))\r
+      racine.add(REXML::Element::new('annee').add_text(@annee.to_s))\r
+\r
+      @realisateurs.each{|r|\r
+         racine.add(REXML::Element::new('realisateur').add_text(r.nom))\r
+      }\r
+   \r
+      @acteurs.each{|a|\r
+         racine.add(REXML::Element::new('acteur').add_text(a.nom))\r
+      }\r
+      @pays.each{|p|\r
+         racine.add(REXML::Element::new('pays').add_text(p.nom))\r
+      }      \r
+      racine.add(REXML::Element::new('duree').add_text(@duree.to_s))\r
+\r
+      racine.add(REXML::Element::new('critiquePresse').add_text(@critiquePresse.to_s))\r
+      racine.add(REXML::Element::new('critiqueSpectateur').add_text(@critiqueSpectateur.to_s))\r
+      @genres.each{|g|\r
+         racine.add(REXML::Element::new('genre').add_text(g.nom))\r
+      }      \r
+      racine.add(REXML::Element::new('synopsis').add_text(@synopsis))\r
+      budgetElement = REXML::Element::new('budget')\r
+      budgetElement.add_text(@budget.to_s)\r
+      budgetElement.add_attribute('unite', @budgetUnite)\r
+      racine.add(budgetElement)\r
+\r
+      racine\r
+   end\r
+end\r
+  
\ No newline at end of file
diff --git a/src/genre.rb b/src/genre.rb
new file mode 100644 (file)
index 0000000..9731494
--- /dev/null
@@ -0,0 +1,25 @@
+\r
+require 'objet.rb'\r
+\r
+class Genre < Objet\r
+   attr_reader :nom\r
+   \r
+   @@genres = {}\r
+   \r
+   #ajoute un genre et le retourne\r
+   def Genre::ajouter(nom)   \r
+      if nil == genre = @@genres[nom]\r
+         genre = Genre::new(nom)\r
+         @@genres[nom] = genre\r
+      end\r
+      genre\r
+   end\r
+   \r
+   def initialize(nom)\r
+      @nom = nom\r
+   end\r
+   \r
+   def getXml\r
+   \r
+   end\r
+end\r
diff --git a/src/objet.rb b/src/objet.rb
new file mode 100644 (file)
index 0000000..5da9c35
--- /dev/null
@@ -0,0 +1,12 @@
+\r
+class Objet\r
+   @@compteur = 0\r
+   def initialize\r
+      @id = @@compteur + 1\r
+      @@compteur += 1 \r
+   end\r
+   \r
+   def getXml\r
+      #abstrait\r
+   end\r
+end\r
diff --git a/src/pays.rb b/src/pays.rb
new file mode 100644 (file)
index 0000000..934dca2
--- /dev/null
@@ -0,0 +1,25 @@
+\r
+require 'objet.rb'\r
+\r
+class Pays < Objet\r
+   attr_reader :nom\r
+   \r
+   @@pays = {}\r
+   \r
+   #ajoute un pays et le retourne\r
+   def Pays::ajouter(nom)\r
+      if nil == pays = @@pays[nom]\r
+         pays = Pays::new(nom)\r
+         @@pays[nom] = pays\r
+      end\r
+      pays   \r
+   end\r
+   \r
+   def initialize(nom)\r
+      @nom = nom\r
+   end\r
+   \r
+   def getXml\r
+   \r
+   end\r
+end\r
diff --git a/src/personne.rb b/src/personne.rb
new file mode 100644 (file)
index 0000000..5f9d8fa
--- /dev/null
@@ -0,0 +1,25 @@
+\r
+require 'objet.rb'\r
+\r
+class Personne < Objet\r
+   attr_reader :nom\r
+\r
+   @@personnes = {}\r
+   \r
+   #ajoute une personne et la retourne\r
+   def Personne::ajouter(nom)\r
+      if nil == personne = @@personnes[nom]\r
+         personne = Personne::new(nom)\r
+         @@personnes[nom] = personne\r
+      end\r
+      personne\r
+   end\r
+   \r
+   def initialize(nom)\r
+      @nom = nom\r
+   end\r
+   \r
+   def getXml\r
+   \r
+   end\r
+end\r
index d978de6..93001ef 100644 (file)
-require 'rexml/document'\r
-require 'net/http'\r
-require 'thread'\r
-require 'thwait'\r
-require 'cgi'\r
-\r
-# G.Burri fait à l'arrache d'après : 'www.la-rache.com'\r
-\r
-#constantes\r
-FILMS_EXTENSIONS = ['avi', 'mkv', 'rmvb', 'ogm', 'divx']\r
-FICHIER_PATTERN = "<title> [<codec>] [<lang-audio>] [<lang-st>] [<team>]" # la structure d'un fichier\r
-LOAD_DATA = true # charge les informations depuis le web ?\r
-\r
-#le nombre de connexions simultanés sur le site de films\r
-NB_CONN_MAX = 20\r
-\r
-class Objet\r
-   @@compteur = 0\r
-   def initialize\r
-      @id = @@compteur + 1\r
-      @@compteur += 1 \r
-   end\r
-   \r
-   def getXml\r
-      #abstrait\r
-   end\r
-end\r
-\r
-class Personne < Objet\r
-   attr_reader :nom\r
-\r
-   @@personnes = {}\r
-   \r
-   #ajoute une personne et la retourne\r
-   def Personne::ajouter(nom)\r
-      if nil == personne = @@personnes[nom]\r
-         personne = Personne::new(nom)\r
-         @@personnes[nom] = personne\r
-      end\r
-      personne\r
-   end\r
-   \r
-   def initialize(nom)\r
-      @nom = nom\r
-   end\r
-   \r
-   def getXml\r
-   \r
-   end\r
-end\r
-\r
-class Genre < Objet\r
-   attr_reader :nom\r
-   \r
-   @@genres = {}\r
-   \r
-   #ajoute un genre et le retourne\r
-   def Genre::ajouter(nom)   \r
-      if nil == genre = @@genres[nom]\r
-         genre = Genre::new(nom)\r
-         @@genres[nom] = genre\r
-      end\r
-      genre\r
-   end\r
-   \r
-   def initialize(nom)\r
-      @nom = nom\r
-   end\r
-   \r
-   def getXml\r
-   \r
-   end\r
-end\r
-\r
-class Pays < Objet\r
-   attr_reader :nom\r
-   \r
-   @@pays = {}\r
-   \r
-   #ajoute un pays et le retourne\r
-   def Pays::ajouter(nom)\r
-      if nil == pays = @@pays[nom]\r
-         pays = Pays::new(nom)\r
-         @@pays[nom] = pays\r
-      end\r
-      pays   \r
-   end\r
-   \r
-   def initialize(nom)\r
-      @nom = nom\r
-   end\r
-   \r
-   def getXml\r
-   \r
-   end\r
-end\r
-\r
-class Film\r
-   attr_accessor :titre, :fichier, :annee, :realisateurs, :acteurs, :pays, :duree, :critiquePresse, :critiqueSpectateur, :genres, :synopsis, :budget\r
-      \r
-   # les films indexés par leur titre\r
-   @@films = {}\r
-   #les films indexés par leur nom de fichier\r
-   @@filmsFichier = {}\r
-\r
-   @@mutex = Mutex::new\r
-   @@threadsWait = ThreadsWait::new\r
-   @@nbConn = 0\r
-   \r
-   def Film::litRepertoire(r)\r
-      Film::litRepertoireR(r)\r
-      #on attends que les threads se terminent\r
-      @@threadsWait.all_waits\r
-   end\r
-   \r
-   # Charge les films contenus dans un fichier XML.\r
-   def Film::loadFilmsXml(xmlFile)\r
-      racine = REXML::Document::new(File::new(xmlFile)).root\r
-      racine.each_element{|e|\r
-         fichier = e.get_elements('fichier')[0].get_text\r
-         next if fichier == nil\r
-         titre = e.get_elements('titre')[0].get_text\r
-         annee = e.get_elements('annee')[0].get_text\r
-         duree = e.get_elements('duree')[0].get_text\r
-         critiquePresse = e.get_elements('critiquePresse')[0].get_text\r
-         critiqueSpectateur = e.get_elements('critiqueSpectateur')[0].get_text\r
-         synopsis = e.get_elements('synopsis')[0].get_text\r
-         budget = e.get_elements('budget')[0].get_text  \r
-         realisateurs = e.get_elements('realisateur')\r
-         acteurs = e.get_elements('acteur')\r
-         pays = e.get_elements('pays')\r
-         genres = e.get_elements('genres')\r
-         \r
-      \r
-         film = Film::new(fichier.value)\r
-         film.titre = titre.value unless titre.nil?\r
-         film.annee = annee.value unless annee.nil?\r
-         realisateurs.each{|e|\r
-            film.realisateurs << Personne::ajouter(e.get_text.value)\r
-         }        \r
-         acteurs.each{|e|\r
-            film.acteurs << Personne::ajouter(e.get_text.value)\r
-         }\r
-         pays.each{|e|\r
-            film.pays << Pays::ajouter(e.get_text.value)\r
-         }\r
-         film.duree = duree.value unless duree.nil?\r
-         film.critiquePresse = critiquePresse.value unless critiquePresse.nil?\r
-         film.critiqueSpectateur = critiqueSpectateur.value unless critiqueSpectateur.nil?\r
-         genres.each{|e|\r
-            film.genres << Genre::ajouter(e.get_text.value)\r
-         }\r
-         film.synopsis = synopsis.value unless synopsis.nil?\r
-         film.budget = budget.value unless budget.nil?\r
-         @@films[film.titre] = film\r
-         @@filmsFichier[film.fichier] = film\r
-      }   \r
-   end\r
-   \r
-   # Renvoie tous les films sous la forme d'un élement XML.\r
-   def Film::getFilmsXml\r
-      racine = REXML::Element::new('filmographie')\r
-      @@films.each{|nom, f|\r
-         racine.add(f.getXml)\r
-      } \r
-      return REXML::Document::new.add(racine)\r
-   end\r
-\r
-private\r
-   def Film::litRepertoireR(r)\r
-      Dir::foreach(r){|f|\r
-         next if f == '.' or f == '..'\r
-         fichier = r + "/" + f\r
-         if File::directory?(fichier)\r
-            litRepertoireR(fichier) \r
-         else\r
-         \r
-            #si le film n'existe pas déjà dans la liste\r
-            if film = @@filmsFichier[fichier]\r
-               puts "[i] Already exists in DB : #{film.titre} (#{film.fichier})"\r
-               next\r
-            end\r
-            \r
-            film = nil   \r
-            @@nbConn += 1    \r
-            @@threadsWait.join_nowait(\r
-               Thread::new{    \r
-                  begin\r
-                     @@mutex.lock if @@nbConn >= NB_CONN_MAX                     \r
-                     #p @@nbConn     \r
-                     film = Film::filmsFactory(fichier)\r
-                     unless film.nil?\r
-                        if @@films.has_key?(film.titre)\r
-                           puts "[!] Duplicate movie : #{film.titre} (#{film.fichier})"\r
-                        else\r
-                           puts "[i] movie added : #{film.titre} (#{film.fichier})"\r
-                           @@films[film.titre] = film\r
-                           @@filmsFichier[film.fichier] = film\r
-                        end\r
-                     end\r
-                     @@nbConn -= 1\r
-                     #p @@nbConn\r
-                     @@mutex.unlock\r
-                  rescue  Exception => e
-                     puts e.message
-                     puts e.backtrace\r
-                  end\r
-               }\r
-            )\r
-         end\r
-      }\r
-   end\r
-   \r
-   def Film::filmsFactory(fichier)\r
-      /^.*?\.(.{3,4})$/ =~ fichier\r
-      if FILMS_EXTENSIONS.include?($1)\r
-         Film::new(fichier).loadData\r
-      end\r
-   end\r
-\r
-public\r
-\r
-   def initialize(fichier)\r
-      @fichier = fichier\r
-      @titre = ''\r
-      @annee = nil\r
-      @realisateurs = []\r
-      @acteurs = []\r
-      @pays = []\r
-      @duree = nil\r
-      @critiquePresse = nil\r
-      @critiqueSpectateur = nil\r
-      @genres = []\r
-      @synopsis = nil\r
-      @budget = nil      \r
-      @budgetUnite = 'euro'\r
-   end\r
-   \r
-   #charge les informations du films à partir d'allocine\r
-   def loadData\r
-      unless LOAD_DATA\r
-         @titre = @fichier\r
-         return self\r
-      end\r
-\r
-      connexionHttp = Net::HTTP::new('www.allocine.fr');\r
-   \r
-      #extrait le nom à partire du nom du fichier\r
-      /^.*?([^\/]*?)\.(.{3,4})$/ =~ @fichier\r
-      #remplace undescores et points par des espaces\r
-      titre = $1.gsub(/[_\.]/, ' ')\r
-      #vire les espaces au début et à la fin\r
-      titre.strip!\r
-      #remplace les suites d'espaces par un seul\r
-      titre.gsub!(/ {2,}/,' ')\r
-      titre.gsub!(/\[.*?\]/,'')\r
-      titre.gsub!(/\(.*?\)/,'')\r
-      @titre = titre.dup\r
-      \r
-      donneesHtml = nil\r
-      begin\r
-         reponse, donneesHtml = connexionHttp.get("/recherche/?motcle=#{CGI::escape(titre)}")\r
-         #si pas trouvé alors on enlève un mot à la fin\r
-         if /.*?Pas de résultats.*?/ =~ donneesHtml\r
-            /(.*?)[^ ]+?$/ =~ titre.strip\r
-            titre = $1\r
-            titre.strip!\r
-         else\r
-            break;\r
-         end\r
-      end while not titre.nil? and not titre.empty?\r
-      \r
-      unless titre.nil? or titre.empty?\r
-         /<a href="\/film\/fichefilm_gen_cfilm=(\d+)\.html" class="link1">/ =~ donneesHtml\r
-         if $1\r
-            r, ficheHtml = connexionHttp.get("/film/fichefilm_gen_cfilm=#{$1}.html")      \r
-            \r
-            # Titre\r
-            /<title>(.*?)<\/title>/ =~ ficheHtml\r
-            @titre = $1 unless $1.nil?\r
-            \r
-            #puts "Movie found : #{@titre} (#{@fichier})"\r
-            \r
-            # Année\r
-            /<h4>Année de production : (\d+)<\/h4>/ =~ ficheHtml\r
-            @annee = $1.to_i unless $1.nil?     \r
-            \r
-            # Réalisateurs\r
-            /Réalisé par <a class="link1" href=".*?" target="">(.*?)<\/a>/ =~ ficheHtml\r
-            @realisateurs << Personne::ajouter($1) unless $1.nil?\r
-                        \r
-            # Acteurs\r
-            /Avec(.*)/ =~ ficheHtml\r
-            $1.scan(/<a class="link1" href="\/personne\/fichepersonne_gen_cpersonne=\d+\.html" target="">(.+?)<\/a>/m){|a|\r
-               @acteurs << Personne::ajouter(a[0]) unless a[0].nil? \r
-            } unless $1.nil?     \r
-                      \r
-            # Pays\r
-            /^<h4>Film (.*?)\.<\/h4>/ =~ ficheHtml\r
-            $1.split(',').each{|pays|\r
-               @pays << Pays::ajouter(pays) unless pays.nil?\r
-            } unless $1.nil? \r
-            \r
-            # Duree\r
-            /<h4>Durée : (\d+?)h (\d+?)min.<\/h4>/ =~ ficheHtml\r
-            @duree = $1.nil? ? $2.to_i : $1.to_i * 60 + $2.to_i\r
-            \r
-            # Critique presse\r
-            /Presse<\/a> <img src=".*?etoile_(\d)\.gif"/ =~ ficheHtml\r
-            @critiquePresse = $1.to_i unless $1.nil?\r
-                                    \r
-            # Critique spectateur\r
-            /Spectateurs<\/a> <img src=".*?etoile_(\d)\.gif"/ =~ ficheHtml\r
-            @critiqueSpectateur = $1.to_i unless $1.nil?\r
-            \r
-            # Genre\r
-            /Genre : (.*)/ =~ ficheHtml\r
-            $1.scan(/<a href="\/film\/alaffiche_genre_gen_genre=.*?" class="link1">(.+?)<\/a>/m){|g|\r
-               @genres << Genre::ajouter(g[0]) unless g[0].nil?\r
-            } unless $1.nil?     \r
-            \r
-            # Synopsis            \r
-            /Synopsis.*?<h4>(.+?)<\/h4>/m =~ ficheHtml\r
-            @synopsis = $1 unless $1.nil?\r
-            \r
-            # Budget       \r
-            /Budget<\/b> : (.+?) millions d'euros<\/h4>/ =~ ficheHtml\r
-            @budget = $1.to_i unless $1.nil?\r
-         else         \r
-            puts "[!] Movie not found : #{@titre} (#{@fichier})"\r
-         end\r
-      end\r
-      self\r
-   end\r
-   \r
-   def getXml   \r
-      racine = REXML::Element::new('film')\r
-      racine.add(REXML::Element::new('fichier').add_text(@fichier))\r
-      racine.add(REXML::Element::new('titre').add_text(@titre))\r
-      racine.add(REXML::Element::new('annee').add_text(@annee.to_s))\r
-     \r
-\r
-      @realisateurs.each{|r|\r
-         racine.add(REXML::Element::new('realisateur').add_text(r.nom))\r
-      }\r
-   \r
-      @acteurs.each{|a|\r
-         racine.add(REXML::Element::new('acteur').add_text(a.nom))\r
-      }\r
-      @pays.each{|p|\r
-         racine.add(REXML::Element::new('pays').add_text(p.nom))\r
-      }      \r
-      racine.add(REXML::Element::new('duree').add_text(@duree.to_s))\r
-\r
-      racine.add(REXML::Element::new('critiquePresse').add_text(@critiquePresse.to_s))\r
-      racine.add(REXML::Element::new('critiqueSpectateur').add_text(@critiqueSpectateur.to_s))\r
-      @genres.each{|g|\r
-         racine.add(REXML::Element::new('genre').add_text(g.nom))\r
-      }      \r
-      racine.add(REXML::Element::new('synopsis').add_text(@synopsis))\r
-      budgetElement = REXML::Element::new('budget')\r
-      budgetElement.add_text(@budget.to_s)\r
-      budgetElement.add_attribute('unite', @budgetUnite)\r
-      racine.add(budgetElement)\r
-\r
-      racine\r
-   end\r
-end\r
-\r
-\r
+# YopYop est un super programme permettant de :\r
+# - Parcourir des dossiers recursivement à la recherche de fichier video\r
+# - Parser les fichiers afin d'en retirer les infos suivantes :\r
+#  o le codec video\r
+#  o le codec son\r
+#  o les pistes audio\r
+#  o les sous-titres disponible\r
+# - Les formats supportés  :\r
+#  o avi\r
+#  o ogm\r
+#  o mkv\r
+#  o rmvb\r
+# - Rechercher chaque film sur le site 'allocine.com' et en pomper un max d'infos\r
+# - Etablir une petit base de données des films au format xml\r
+\r
+\r
+$: << Dir::getwd + "/" + __FILE__.split('/')[0]\r
+\r
+require 'film.rb'\r
+\r
+# vérifie les arguments données\r
 rep = '.'\r
 if $*.empty?\r
    puts 'USAGE : <xml file> [<directory>]'\r
@@ -391,4 +42,4 @@ Film::loadFilmsXml(xmlFile)
 Film::litRepertoire(rep)\r
 \r
 # ecrit le fichier XML\r
-Film::getFilmsXml.write(File::new(xmlFile, 'w'))\r
+Film::getFilmsXml.write(File::new(xmlFile, 'w'), 1)\r