

aparte de que hay que hacer varias modificaciones de paginas, para empezar he empezado recuperando "películas" con esto( 1080p, 720 etc, difieren en patrón pero eso para después)
Código: Seleccionar todo
#<div class="blogitem "><a title="En Un Patio De Paris [DVD Rip]" href="/peliculas/17937-en-un-patio-de-paris-dvd-rip"><div class="thumbnail_wrapper"><img alt="En Un Patio De Paris [DVD Rip]" src="http://www.zentorrents.com/images/articles/17/17937t.jpg" onload="imgLoaded(this)" /></div></a><div class="info"><div class="title"><a title="En Un Patio De Paris [DVD Rip]" href="/peliculas/17937-en-un-patio-de-paris-dvd-rip" class="contentpagetitleblog">En Un Patio De Paris [DVD Rip]</a></div><div class="createdate">21/01/2015</div><div class="text">[DVD Rip][AC3 5.1 Español Castellano][2014] Antoine es un músico de 40 años que de pronto decide abandonar su carrera.</div></div><div class="clr"></div></div>
Código: Seleccionar todo
def findvideos(item):
logger.info("pelisalacarta.zentorrents findvideos")
itemlist = []
# Descarga la página
data = scrapertools.cache_page(item.url)
data = re.sub(r"\n|\r|\t|\s{2}| ","",data)
#href="http://www.zentorrents.com/index.php?option=com_profiles&view=download&id=17833&f=aHR0cDovL3d3dy5kaXZ4YXRvcGUuY29tL3RvcnJlbnQvbGEtaXNsYS1taW5pbWEtMjAxNC0tZW4tYmx1cmF5LTEwODBw&tmpl=component">
patron = 'href="([^"]+)">'
url_torrent = scrapertools.get_match(data, patron)
# Descarga la página
data = re.sub(r"\n|\r|\t|\s{2}| ","",data)
data = scrapertools.cache_page(url)
#{ window.location = 'http://www.divxatope.com/torrent/la-isla-minima-2014--en-bluray-1080p'
patron = "{ window.location = '([^']+)"
url_torrent = scrapertools.get_match(data, patron)
itemlist.append( Item(channel=__channel__, title = "[torrent]", action="play", url=url_torrent, server="torrent", folder=False) )
return itemlist
