X-Git-Url: http://git.euphorik.ch/?a=blobdiff_plain;f=src%2Ffilm.rb;h=30a5bc8487ed283dbc31267a24c8e1cd0e2f4bad;hb=c967b07b58b4588996be0ebefa5a2d10e0663cf6;hp=b79584129237556386e5841c34548651734be1ba;hpb=f67e80719e42ae1e95511df44d65d493a3ead62f;p=pompage.git diff --git a/src/film.rb b/src/film.rb index b795841..30a5bc8 100644 --- a/src/film.rb +++ b/src/film.rb @@ -1,150 +1,33 @@ -require 'rexml/document' +# Représente un Film. +# Permet de charger des données depuis allocine.fr +# Permet d'effectuer des recherches depuis allocine.fr +# TODO : rendre la classe indépendant de la source de donnée pour pouvoir utiliser d'autres sites comme par exemple imdb.com + require 'net/http' -require 'thread' -require 'thwait' require 'cgi' require 'pays.rb' require 'genre.rb' require 'personne.rb' - require 'constantes.rb' -class Film - attr_accessor :titre, :fichier, :annee, :realisateurs, :acteurs, :pays, :duree, :critiquePresse, :critiqueSpectateur, :genres, :synopsis, :budget - - # Les films indexés par leur titre - @@films = {} - - # Les films indexés par leur nom de fichier - @@filmsFichier = {} - - @@mutex = Mutex::new - @@threadsWait = ThreadsWait::new - @@nbConn = 0 - - - # Lit un repertoire de manière recursive - def Film::litRepertoire(r) - Film::litRepertoireR(r) - # on attends que les threads se terminent - @@threadsWait.all_waits - end - - # Charge les films contenus dans un fichier XML. - def Film::loadFilmsXml(xmlFile) - # si le fichier n'existe pas il n'y a rien à charger - if !File.exists?(xmlFile) - return - end - - racine = REXML::Document::new(File::new(xmlFile)).root - racine.each_element{|e| - fichier = e.get_elements('fichier')[0].get_text - next if fichier == nil - titre = e.get_elements('titre')[0].get_text - annee = e.get_elements('annee')[0].get_text - duree = e.get_elements('duree')[0].get_text - critiquePresse = e.get_elements('critiquePresse')[0].get_text - critiqueSpectateur = e.get_elements('critiqueSpectateur')[0].get_text - synopsis = e.get_elements('synopsis')[0].get_text - budget = e.get_elements('budget')[0].get_text - realisateurs = e.get_elements('realisateur') - acteurs = e.get_elements('acteur') - pays = e.get_elements('pays') - genres = e.get_elements('genres') - - - film = Film::new(fichier.value) - film.titre = titre.value unless titre.nil? - film.annee = annee.value unless annee.nil? - realisateurs.each{|e| - film.realisateurs << Personne::ajouter(e.get_text.value) - } - acteurs.each{|e| - film.acteurs << Personne::ajouter(e.get_text.value) - } - pays.each{|e| - film.pays << Pays::ajouter(e.get_text.value) - } - film.duree = duree.value unless duree.nil? - film.critiquePresse = critiquePresse.value unless critiquePresse.nil? - film.critiqueSpectateur = critiqueSpectateur.value unless critiqueSpectateur.nil? - genres.each{|e| - film.genres << Genre::ajouter(e.get_text.value) - } - film.synopsis = synopsis.value unless synopsis.nil? - film.budget = budget.value unless budget.nil? - @@films[film.titre] = film - @@filmsFichier[film.fichier] = film - } +class String + def virerBalisesHTML + return gsub(/<(.*?)>/, '') end - - # Renvoie tous les films sous la forme d'un élement XML. - def Film::getFilmsXml - racine = REXML::Element::new('filmographie') - @@films.each{|nom, f| - racine.add(f.getXml) - } - return REXML::Document::new.add(racine) + def virerBalisesHTML! + gsub!(/<(.*?)>/, '') end - -private +end - def Film::filmsFactory(fichier) - /^.*?\.(.{3,4})$/ =~ fichier - if FILMS_EXTENSIONS.include?($1) - Film::new(fichier).loadData - end - end - - def Film::litRepertoireR(r) - Dir::foreach(r){|f| - next if f == '.' or f == '..' - fichier = r + "/" + f - if File::directory?(fichier) - litRepertoireR(fichier) - else - - #si le film n'existe pas déjà dans la liste - if film = @@filmsFichier[fichier] - puts "[i] Already exists in DB : #{film.titre} (#{film.fichier})" - next - end - - film = nil - @@nbConn += 1 - @@threadsWait.join_nowait( - Thread::new{ - begin - @@mutex.lock if @@nbConn >= NB_CONN_MAX - #p @@nbConn - film = Film::filmsFactory(fichier) - unless film.nil? - if @@films.has_key?(film.titre) - puts "[!] Duplicate movie : #{film.titre} (#{film.fichier})" - else - puts "[i] movie added : #{film.titre} (#{film.fichier})" - @@films[film.titre] = film - @@filmsFichier[film.fichier] = film - end - end - @@nbConn -= 1 - #p @@nbConn - @@mutex.unlock - rescue Exception => e - puts e.message - puts e.backtrace - end - } - ) - end - } - end +class Film + attr_accessor :id, :titre, :fichiers, :annee, :realisateurs, :acteurs, :pays, :duree, :critiquePresse, :critiqueSpectateur, :genres, :synopsis, :budget - + # Constructeur. N'entreprend aucune action (chargement), crée juste un film vide. def initialize(fichier) - @fichier = fichier + @fichiers = [fichier] + + @id = 0 @titre = '' @annee = nil @realisateurs = [] @@ -157,35 +40,104 @@ private @synopsis = nil @budget = nil @budgetUnite = 'euro' + @url + + @aPlusieursReponses = false + # mémorise les tuples {nom => id} dans le cas ou il y a plusieurs réponses + @idsAllocine = {} end -public - #charge les informations du films à partir d'allocine.fr + # Est-ce qu'il y a eu plusieurs réponses pour ce film lors de la cherche sur le net ? + def plusieursReponses? + return @aPlusieursReponses + end + + # Demande à l'utilisateur de faire un choix + # ret : true si le conflit à été résolu sinon false + def reglerConflitPlusieursReponses + + @aPlusieursReponses = false # pour faire les choses bien + + puts " -> " + @fichiers[0] + puts "Fais ton choix jeune padawan (un caractère et pas plus)" + tabNoms = @idsAllocine.keys + choix = 1 + loop do + i = 1 + tabNoms.each{|n| + puts "#{i}. #{n}" + i += 1 + } + puts "A. Passer et l'ajouter" + puts "B. Ignorer" + choix = STDIN.gets + + if /A/i =~ choix + return true + elsif /B/i =~ choix + return false + end + + choix = choix.to_i + if choix > 0 && choix <= tabNoms.length + break; + else + puts + puts "Choix pas bon !!" + end + end + + loadDepuisIdAllocine(@idsAllocine[tabNoms[choix-1]]) + + return true + end + + # Ajoute un fichier comme faisant partie du film + def addFichier(fichier) + if !@fichiers.include?(fichier) + @fichiers << fichier + end + end + + # Charge les informations du films à partir d'allocine.fr + # ret [Film] def loadData unless LOAD_DATA - @titre = @fichier + @titre = @fichiers[0] return self end - connexionHttp = Net::HTTP::new('www.allocine.fr'); + connexionHttp = Net::HTTP::new('www.allocine.fr') - #extrait le nom à partire du nom du fichier - /^.*?([^\/]*?)\.(.{3,4})$/ =~ @fichier + #extrait le nom à partir du nom du fichier + /^.*?([^\/]*?)\.(.{3,4})$/ =~ @fichiers[0] #remplace undescores et points par des espaces titre = $1.gsub(/[_\.]/, ' ') - #vire les espaces au début et à la fin - titre.strip! #remplace les suites d'espaces par un seul titre.gsub!(/ {2,}/,' ') titre.gsub!(/\[.*?\]/,'') titre.gsub!(/\(.*?\)/,'') + titre.gsub!(/\{.*?\}/,'') + #vire les espaces au début et à la fin + titre.strip! + @titre = titre.dup donneesHtml = nil begin - reponse, donneesHtml = connexionHttp.get("/recherche/?motcle=#{CGI::escape(titre)}") - #si pas trouvé alors on enlève un mot à la fin - if /.*?Pas de résultats.*?/ =~ donneesHtml + begin + reponse, donneesHtml = connexionHttp.get("/recherche/?motcle=#{CGI::escape(titre.unpack("U*").pack("C*"))}") + rescue Exception => e + p e + puts "[!] Connexion lost, retry.." + retry + end + + #convertit le code latin-1 en UTF8 + donneesHtml = donneesHtml.unpack("C*").pack("U*") + + #si pas trouvé alors on enlève un mot à la fin + if /.*?Pas de résultats.*?/ =~ donneesHtml || ! donneesHtml.include?("