hola de nuevo. Mira, con el regex online he conseguido verificar que mis patrones son correctos(o eso me parece ) pero por ejemplo, con este canal que estoy entrenando(dejando aun lado el fingidos y demás, porque lo primero es ser capaz de hacer lo básico) me sigue saliendo las categorías vacías. no sé si es la dificultad de la web en si, que soy un cenutrio, o que la clave esta en los "matches" haber si puedes decirme que he hecho mal(casi todo supongo)
# -*- coding: utf-8 -*-
#------------------------------------------------------------
# pelisalacarta - XBMC Plugin
#
http://blog.tvalacarta.info/plugin-xbmc/pelisalacarta/
#------------------------------------------------------------
import urlparse,urllib2,urllib,re
import os, sys
from core import logger
from core import config
from core import scrapertools
from core.item import Item
from servers import servertools
__channel__ = "cuelgame"
__category__ = "F"
__type__ = "generic"
__title__ = "Cuélgame"
__language__ = "ES"
DEBUG = config.get_setting("debug")
def isGeneric():
return True
def mainlist(item):
logger.info("pelisalacarta.cuelgame mainlist")
itemlist = []
itemlist.append( Item(channel=__channel__, title="Películas" , action="peliculas", url="
http://www.bricocine.com/c/hd-microhd/"))
itemlist.append( Item(channel=__channel__, title="Series" , action="peliculas", url="
http://www.bricocine.com/c/series/"))
return itemlist
def peliculas(item):
logger.info("pelisalacarta.cuelgame peliculas")
itemlist = []
# Descarga la página
data = scrapertools.cache_page(item.url)
'''
<div class="post-10888 post type-post status-publish format-standard hentry category-the-leftovers tag-ciencia-ficcion tag-drama tag-fantasia tag-misterio"><div class="entry"> <a href="
http://www.bricocine.com/10888/leftovers-temporada-1/"> <img src="
http://www.bricocine.com/wp-content/plu ... overs_.jpg" alt="The Leftovers " /> </a></div><div class="entry-meta"><div class="clearfix"><div itemprop="aggregateRating" itemscope itemtype="
http://schema.org/AggregateRating" class="rating" title="Puntos IMDB: 7.4"><div class="rating-stars imdb-rating"><div class="stars" style="width:74%"></div></div><div itemprop="ratingValue" class="rating-number"> 7.4</div></div><div itemprop="aggregateRating" itemscope itemtype="
http://schema.org/AggregateRating" class="rating" title="Puntos Bricocine: 6.2"><div class="rating-stars brico-rating"><div class="stars" style="width:62%"></div></div><div itemprop="ratingValue" class="rating-number"> 6.2</div></div> <span class="vcard author none"> Publicado por <a class="fn" href="" rel="author" target="_blank"></a> </span> <span class="date updated none">2014-10-07T23:36:17+00:00</span></div></div><h2 class="title2 entry-title"> <a href="
http://www.bricocine.com/10888/leftovers-temporada-1/"> The Leftovers – Temporada 1 </a></h2></div> </article> <article class="hentry item-entry"><div class="post-10088 post type-post status-publish format-standard hentry category-the-last-ship tag-accion tag-ciencia-ficcion tag-drama tag-the tag-thriller"><div class="entry"> <a href="
http://www.bricocine.com/10088/last-ship-temporada-1/"> <img src="
http://www.bricocine.com/wp-content/plu ... _ship_.jpg" alt="The Last Ship " /> </a></div><div class="entry-meta"><div class="clearfix"><div itemprop="aggregateRating" itemscope itemtype="
http://schema.org/AggregateRating" class="rating" title="Puntos IMDB: 7.4"><div class="rating-stars imdb-rating"><div class="stars" style="width:74%"></div></div><div itemprop="ratingValue" class="rating-number"> 7.4</div></div><div itemprop="aggregateRating" itemscope itemtype="
http://schema.org/AggregateRating" class="rating" title="Puntos Bricocine: 7.0"><div class="rating-stars brico-rating"><div class="stars" style="width:70%"></div></div><div itemprop="ratingValue" class="rating-number"> 7.0</div></div> <span class="vcard author none"> Publicado por <a class="fn" href="" rel="author" target="_blank"></a> </span> <span class="date updated none">2014-10-07T23:32:25+00:00</span></div></div><h2 class="title2 entry-title"> <a href="
http://www.bricocine.com/10088/last-ship-temporada-1/"> The Last Ship – Temporada 1 </a></h2></div> </article> <article class="hentry item-entry">
'''
patron = '<div class=.*?>'
patron += '<a href="([^"]+)">'
patron += '<img src="([^"]+)" alt="([^"]+)".*?'
patron += 'alt="([^"]+)".*?'
patron += 'class="rating-number">([^<]+)</div></div>'
matches = re.compile(patron,re.DOTALL).findall(data)
scrapertools.printMatches(matches)
for scrapedurl, scrapedthumbnail, scrapedtitle, scrapeddate in matches:
itemlist.append( Item(channel=__channel__, title=scrapedtitle, url=scrapedurl, action="findvideos", thumbnail=scrapedthumbnail, folder=True) )
oye si te resulta pesao esto me lo dices eh? sin problema