X-Git-Url: http://git.euphorik.ch/?a=blobdiff_plain;ds=inline;f=src%2Ffilm.rb;h=1eaa33f9ed97f307d68e3098dcd58cbad26602b9;hb=0b9caa9ca5fcf916c389d71b3170cdb2e060ae5c;hp=658b9d3a1f4550dd532cf4e84efb0bb5687fbedb;hpb=4a7c8c22be64edd01037a64105aaa76aec5fb405;p=pompage.git diff --git a/src/film.rb b/src/film.rb index 658b9d3..1eaa33f 100644 --- a/src/film.rb +++ b/src/film.rb @@ -11,24 +11,44 @@ require 'personne.rb' require 'constantes.rb' class Film - attr_accessor :titre, :fichier, :annee, :realisateurs, :acteurs, :pays, :duree, :critiquePresse, :critiqueSpectateur, :genres, :synopsis, :budget + attr_accessor :id, :titre, :fichiers, :annee, :realisateurs, :acteurs, :pays, :duree, :critiquePresse, :critiqueSpectateur, :genres, :synopsis, :budget - # Les films indexés par leur titre + # Les films indexés par leur titre @@films = {} - # Les films indexés par leur nom de fichier + # Les films indexés par leur nom de fichier, deux fichiers différents peuvent pointer sur le même film @@filmsFichier = {} + + # Les films qui ont plusieurs réponses lors de la recherche, traités à la fin + @@filmsPlusieursReponses = [] @@mutex = Mutex::new @@threadsWait = ThreadsWait::new @@nbConn = 0 + + # le prochain id disponible + @@idDisponible = 1 + + # retourne un nouvel id, utilisé lors de la création d'un nouveau film + def Film::getNewId + id = @@idDisponible + @@idDisponible += 1 + return id + end - - # Lit un repertoire de manière recursive + # Lit un repertoire de manière recursive def Film::litRepertoire(r) Film::litRepertoireR(r) # on attends que les threads se terminent @@threadsWait.all_waits + + # traite les films qui avaient plusieurs réponses lors de la recherche + # l'utilisateur doit faire un choix + @@filmsPlusieursReponses.each{|f| + if f.reglerConflitPlusieursReponses + Film::ajouterFilm(f) + end + } end # Charge les films contenus dans un fichier XML. @@ -39,28 +59,33 @@ class Film end racine = REXML::Document::new(File::new(xmlFile)).root - racine.each_element{|e| - fichier = e.get_elements('fichier')[0].get_text - next if fichier == nil + racine.each_element{|e| + id = e.attribute('id').to_s().to_i() + + @@idDisponible = id + 1 titre = e.get_elements('titre')[0].get_text + + fichiers = e.get_elements('fichiers')[0].get_elements('fichier') annee = e.get_elements('annee')[0].get_text duree = e.get_elements('duree')[0].get_text critiquePresse = e.get_elements('critiquePresse')[0].get_text critiqueSpectateur = e.get_elements('critiqueSpectateur')[0].get_text synopsis = e.get_elements('synopsis')[0].get_text budget = e.get_elements('budget')[0].get_text - realisateurs = e.get_elements('realisateur') - acteurs = e.get_elements('acteur') - pays = e.get_elements('pays') - genres = e.get_elements('genres') + realisateurs = e.get_elements('realisateurs')[0].get_elements('realisateur') + acteurs = e.get_elements('acteurs')[0].get_elements('acteur') + pays = e.get_elements('lespays')[0].get_elements('pays') + genres = e.get_elements('genres')[0].get_elements('genre') + + film = Film::new(fichiers[0].get_text.value) - - film = Film::new(fichier.value) film.titre = titre.value unless titre.nil? + film.id = id + fichiers.each{|e| + film.addFichier(e.get_text.value) + @@filmsFichier[e.get_text.value] = film + } film.annee = annee.value unless annee.nil? - realisateurs.each{|e| - film.realisateurs << Personne::ajouter(e.get_text.value) - } acteurs.each{|e| film.acteurs << Personne::ajouter(e.get_text.value) } @@ -71,26 +96,33 @@ class Film film.critiquePresse = critiquePresse.value unless critiquePresse.nil? film.critiqueSpectateur = critiqueSpectateur.value unless critiqueSpectateur.nil? genres.each{|e| - film.genres << Genre::ajouter(e.get_text.value) + film.genres << Genre::ajouter(e.get_text.value) if e.get_text != nil } film.synopsis = synopsis.value unless synopsis.nil? film.budget = budget.value unless budget.nil? @@films[film.titre] = film - @@filmsFichier[film.fichier] = film - } + } end # Renvoie tous les films sous la forme d'un document XML. def Film::getFilmsXml - racine = REXML::Element::new('filmographie') + # le document docXml = REXML::Document::new + docXml.xml_decl().encoding = "UTF-8" # normalement UTF-8 + docXml.xml_decl().dowrite + + # la racine du document + racine = REXML::Element::new('filmographie') docXml.add(racine) - docXml.xml_decl().encoding = "UTF-8" - docXml.xml_decl().dowrite + pi = REXML::Instruction.new("xml-stylesheet", "type=\"text/xsl\" href=\"../xsl/yopyop.xsl\"") + racine.previous_sibling = pi + # on ajoute chaque film à la racine @@films.each{|nom, f| racine.add(f.getXml) } + + # revoie le document docXml end @@ -99,7 +131,8 @@ private def Film::filmsFactory(fichier) /^.*?\.(.{3,4})$/ =~ fichier if FILMS_EXTENSIONS.include?($1) - Film::new(fichier).loadData + #convertit le code latin-1 en UTF8 + Film::new(fichier.unpack("C*").pack("U*")).loadData end end @@ -111,9 +144,9 @@ private litRepertoireR(fichier) else - #si le film n'existe pas déjà dans la liste + #si le film n'existe pas déjà dans la liste if film = @@filmsFichier[fichier] - puts "[i] Already exists in DB : #{film.titre} (#{film.fichier})" + puts "[i] Already exists in DB : #{film.titre} (#{film.fichiers[0]})" next end @@ -124,20 +157,13 @@ private Thread::new{ begin @@mutex.lock if @@nbConn >= NB_CONN_MAX - film = Film::filmsFactory(fichier) - unless film.nil? - if @@films.has_key?(film.titre) - puts "[!] Duplicate movie : #{film.titre} (#{film.fichier})" - else - puts "[i] movie added : #{film.titre} (#{film.fichier})" - @@films[film.titre] = film - @@filmsFichier[film.fichier] = film - end + film = Film::filmsFactory(fichier) + unless film.nil? # le film a été correctement construit + Film::ajouterFilm(film) end @@nbConn -= 1 - #p @@nbConn @@mutex.unlock - rescue Exception => e + rescue Exception => e puts e.message puts e.backtrace end @@ -145,11 +171,36 @@ private ) end } - end - + end + + def Film::ajouterFilm(film) + if film.plusieursReponses? + @@filmsPlusieursReponses << film + return + end + + # le film existe déjà + if @@films.has_key?(film.titre) + # le fichier n'est pas connu -> nième partie d'un film + if !@@filmsFichier.has_key?(film.fichiers[0]) + puts "[i] movie #{film.titre} has a another file part : #{film.fichiers[0]}" + @@films[film.titre].addFichier(film.fichiers[0]) + @@filmsFichier[film.fichiers[0]] = @@films[film.titre] + else + puts "[!] Duplicate movie : #{film.titre} (#{film.fichier})" + end + else + puts "[i] movie added : #{film.titre} (#{film.fichiers[0]})" + @@films[film.titre] = film + @@filmsFichier[film.fichiers[0]] = film + end + end + def initialize(fichier) - @fichier = fichier + @fichiers = [fichier] + + @id = 0 @titre = '' @annee = nil @realisateurs = [] @@ -162,37 +213,74 @@ private @synopsis = nil @budget = nil @budgetUnite = 'euro' + @url + + @aPlusieursReponses = false + # mémorise les tuples {nom => id} dans le cas ou il y a plusieurs réponses + @idsAllocine = {} end public - # Charge les informations du films à partir d'allocine.fr - # ret [Film] : soit même + def plusieursReponses? + return @aPlusieursReponses + end + + # demande à l'utilisateur de faire un choix + # ret : true si le conflit à été résolu sinon false + def reglerConflitPlusieursReponses + puts "prout" + + return false + end + + def addFichier(fichier) + if (!@fichiers.include?(fichier)) + @fichiers << fichier + end + end + + # Charge les informations du films à partir d'allocine.fr + # ret [Film] def loadData unless LOAD_DATA - @titre = @fichier + @titre = @fichiers[0] return self end + + @id = Film::getNewId - connexionHttp = Net::HTTP::new('www.allocine.fr'); + connexionHttp = Net::HTTP::new('www.allocine.fr') - #extrait le nom à partire du nom du fichier - /^.*?([^\/]*?)\.(.{3,4})$/ =~ @fichier + #extrait le nom à partir du nom du fichier + /^.*?([^\/]*?)\.(.{3,4})$/ =~ @fichiers[0] #remplace undescores et points par des espaces titre = $1.gsub(/[_\.]/, ' ') - #vire les espaces au début et à la fin - titre.strip! #remplace les suites d'espaces par un seul titre.gsub!(/ {2,}/,' ') titre.gsub!(/\[.*?\]/,'') titre.gsub!(/\(.*?\)/,'') + titre.gsub!(/\{.*?\}/,'') + #vire les espaces au début et à la fin + titre.strip! + @titre = titre.dup donneesHtml = nil begin - reponse, donneesHtml = connexionHttp.get("/recherche/?motcle=#{CGI::escape(titre)}") - #si pas trouvé alors on enlève un mot à la fin - if /.*?Pas de résultats.*?/ =~ donneesHtml + begin + reponse, donneesHtml = connexionHttp.get("/recherche/?motcle=#{CGI::escape(titre)}") + rescue Exception => e + p e + puts "[!] Connexion lost, retry.." + retry + end + + #convertit le code latin-1 en UTF8 + donneesHtml = donneesHtml.unpack("C*").pack("U*") + + #si pas trouvé alors on enlève un mot à la fin + if /.*?Pas de résultats.*?/ =~ donneesHtml || ! donneesHtml.include?("