X-Git-Url: http://git.euphorik.ch/?a=blobdiff_plain;f=src%2Ffilm.rb;h=a282441c9dd681fbc7f6b49c44d6c2983716ed93;hb=202a3b4495bc486dc0f5bb6a34da66d5e34832bf;hp=a8a813b01d6fe76ca6a92fdc1b1fb040773585a8;hpb=542290bdf3a6c2fdcffb8bcaf9cac1dc47143f1d;p=pompage.git diff --git a/src/film.rb b/src/film.rb index a8a813b..a282441 100644 --- a/src/film.rb +++ b/src/film.rb @@ -3,14 +3,14 @@ # Permet d'effectuer des recherches depuis allocine.fr # TODO : rendre la classe indépendant de la source de donnée pour pouvoir utiliser d'autres sites comme par exemple imdb.com -require 'net/http' -require 'cgi' - require 'pays.rb' require 'genre.rb' require 'personne.rb' require 'constantes.rb' +require 'modules/allocine.rb' + +# ajout de deux méthodes à la classe String class String def virerBalisesHTML return gsub(/<(.*?)>/, '') @@ -21,11 +21,18 @@ class String end class Film + + def Film::setModule(m) + @@module = m + end + + # toutes les données membres sont accessibles par défaut (écriture/lecture) attr_accessor :id, :titre, :url, :fichiers, :annee, :realisateurs, :acteurs, :pays, :duree, :critiquePresse, :critiqueSpectateur, :genres, :synopsis, :budget # Constructeur. N'entreprend aucune action (chargement), crée juste un film vide. + # p1 [String] : le fichier correspondant au film def initialize(fichier) - @fichiers = [fichier] + @fichiers = [fichier] # le chemin des fichiers est relatif au repertoire de base @id = 0 @titre = '' @@ -41,26 +48,31 @@ class Film @budget = nil @budgetUnite = 'euro' @url + + @nbReponses = 0 - @aPlusieursReponses = false - # mémorise les tuples {nom => id} dans le cas ou il y a plusieurs réponses - @idsAllocine = {} + # mémorise les tuples {nom => id} dans le cas ou il y a plusieurs choix de films après une recherche + @choix = {} end # Est-ce qu'il y a eu plusieurs réponses pour ce film lors de la cherche sur le net ? def plusieursReponses? - return @aPlusieursReponses + return @nbReponses > 1 + end + + # Est-ce qu'il y a eu plusieurs réponses pour ce film lors de la cherche sur le net ? + def nbReponses + return @nbReponses end - # Demande à l'utilisateur de faire un choix - # ret : true si le conflit à été résolu sinon false + # Demande à l'utilisateur de faire un choix. + # ret : 1 si le conflit à été résolu, 2 si le film est à ignorer, 3 si tout les films sont à ignorer def reglerConflitPlusieursReponses - - @aPlusieursReponses = false # pour faire les choses bien + @nbReponses = 1 puts " -> " + @fichiers[0] puts "Fais ton choix jeune padawan (un caractère et pas plus)" - tabNoms = @idsAllocine.keys + tabNoms = @choix.keys choix = 1 loop do i = 1 @@ -70,12 +82,15 @@ class Film } puts "A. Passer et l'ajouter" puts "B. Ignorer" + puts "C. Tout ignorer" choix = STDIN.gets if /A/i =~ choix - return true + return 1 elsif /B/i =~ choix - return false + return 2 + elsif /C/i =~ choix + return 3 end choix = choix.to_i @@ -87,9 +102,9 @@ class Film end end - loadDepuisIdAllocine(@idsAllocine[tabNoms[choix-1]]) + @@module.load(@choix[tabNoms[choix-1]], self) - return true + return 1 end # Ajoute un fichier comme faisant partie du film @@ -101,14 +116,7 @@ class Film # Charge les informations du films à partir d'allocine.fr # ret [Film] - def loadData - unless LOAD_DATA - @titre = @fichiers[0] - return self - end - - connexionHttp = Net::HTTP::new('www.allocine.fr') - + def loadData #extrait le nom à partir du nom du fichier /^.*?([^\/]*?)\.(.{3,4})$/ =~ @fichiers[0] #remplace undescores et points par des espaces @@ -123,48 +131,24 @@ class Film @titre = titre.dup - donneesHtml = nil - begin - begin - reponse, donneesHtml = connexionHttp.get("/recherche/?motcle=#{CGI::escape(titre.unpack("U*").pack("C*"))}") - rescue Exception => e - p e - puts "[!] Connexion lost, retry.." - retry - end - - #convertit le code latin-1 en UTF8 - donneesHtml = donneesHtml.unpack("C*").pack("U*") - - #si pas trouvé alors on enlève un mot à la fin - if /.*?Pas de résultats.*?/ =~ donneesHtml || ! donneesHtml.include?("

Films

") - /(.*?)[^ ]+?$/ =~ titre.strip - titre = $1 - titre.strip! - else - break; - end - end while not titre.nil? and not titre.empty? + unless LOAD_DATA + return self + end - unless titre.nil? or titre.empty? - - r = donneesHtml.scan(/(.*?)<\/a>(?:<\/h4>
 (.*?)<\/h5>){0,1}(?:


<\/h4>){0,1}(?:

de (.*?)<\/h4>){0,1}(?:

 avec (.*?)<\/h4>){0,1}(?:

 \((.*?)\)<\/h4>){0,1}/) - - if r.length > 1 - @aPlusieursReponses = true - r.each{|f| - @idsAllocine[f[1].virerBalisesHTML + (f[2] != nil ? " " + f[2].virerBalisesHTML : "") + (f[3] != nil ? " de " + f[3].virerBalisesHTML : "") + (f[4] != nil ? " avec " + f[4].virerBalisesHTML : "") + (f[5] != nil ? " (" + f[5].virerBalisesHTML + ")" : "")] = f[0] - } - elsif r.length == 1 - loadDepuisIdAllocine(r[0][0], connexionHttp) - else - puts "[!] Movie not found : #{@titre} (#{@fichier})" - end + reponses = @@module.rechercherFilm(titre) + @nbReponses = reponses.size + + if @nbReponses == 1 + @@module.load(reponses.values[0], self) + else + @choix = reponses end + self end - # Renvoie un film sous la forme d'un élément XML de type REXML::Element. + # Renvoie un film sous la forme d'un élément XML . + # ret [REXML::Element] : un element xml def getXml racine = REXML::Element::new('film') @@ -226,80 +210,5 @@ class Film racine end - -private - def loadDepuisIdAllocine(id, connexionHttp = nil) - if (connexionHttp == nil) - connexionHttp = Net::HTTP::new('www.allocine.fr') - end - - r, ficheHtml = connexionHttp.get("/film/fichefilm_gen_cfilm=#{id}.html") - - #convertit le code latin-1 en UTF8 - ficheHtml = ficheHtml.unpack("C*").pack("U*") - - #url - @url = "http://www.allocine.fr/film/fichefilm_gen_cfilm=#{id}.html" - - # Titre - /(.*?)<\/title>/ =~ ficheHtml - @titre = $1 unless $1.nil? - - puts "Movie found : #{@titre} (#{@fichiers[0]})" - - # Année - /<h4>Année de production : (\d+)<\/h4>/ =~ ficheHtml - @annee = $1 unless $1.nil? - - # Réalisateurs - /<h4>Réalisé par(.*?)<\/h4>/ =~ ficheHtml - $1.scan(/\s*<a class="link1" href=".*?">(.*?)<\/a>\s*/m){|a| - @realisateurs << Personne::ajouter(a[0]) unless a[0].nil? - } unless $1.nil? - - # Acteurs - /<h4>Avec(.*?)<\/h4>/ =~ ficheHtml - $1.scan(/\s*<a class="link1" href="\/personne\/fichepersonne_gen_cpersonne=\d+\.html">(.+?)<\/a>\s*/m){|a| - @acteurs << Personne::ajouter(a[0]) unless a[0].nil? - } unless $1.nil? - - # Pays - /<h4>Film (.*?)\. <\/h4>/ =~ ficheHtml - $1.split(',').each{|pays| - @pays << Pays::ajouter(pays) unless pays.nil? - } unless $1.nil? - - # Duree (capture des heures et des minutes séparement vue que c'est le bordel sur allocine - /<h4>Durée :(?:.*?)(\d+)h/ =~ ficheHtml - heure = $1.nil? ? 0 : $1.to_i - - /<h4>Durée :(?:.*?)(\d+)min/ =~ ficheHtml - min = $1.nil? ? 0 : $1.to_i - - @duree = heure * 60 + min - - # Critiques presse et spectateur - /Presse.*etoile_([012345]).*Spectateurs.*etoile_([012345])"/m =~ ficheHtml - @critiquePresse = $1 unless $1.nil? - @critiqueSpectateur = $2 unless $2.nil? - - # Genre - /<h4>Genre : (.*?)<\/h4>/ =~ ficheHtml - $1.scan(/<a href="\/film\/alaffiche_genre_gen_genre=.*?" class="link1">(.+?)<\/a>/m){|g| - @genres << Genre::ajouter(g[0]) unless g[0].nil? - } unless $1.nil? - - # Synopsis - /Synopsis.*?<h4>(.*?)<\/h4>/m =~ ficheHtml - unless $1.nil? - @synopsis = $1 - @synopsis.gsub!(/<br\s*\/>|<br\s*>/, "\n") - @synopsis.virerBalisesHTML! - end - - # Budget - /Budget<\/b> : (.+?) millions d'euros<\/h4>/ =~ ficheHtml - @budget = $1 unless $1.nil? - end end \ No newline at end of file