hola a todos disculpadme por haberme tardado tanto en responder, hoy retome esto, sigo estancada en la paginacion,
next_page_url = scrapertools.find_single_match(data,'<li><a href="([^"]+)">[^"]+</a></li><li>')
he puesto esa y finalmente hice casoy puse el que me dijisteis,
Código: Seleccionar todo
next_page_url = scrapertools.find_single_match(data,'<li><a href="([^"]+)" title="Siguiente')
if next_page_url!="":
import inspect
itemlist.append(
Item(
channel = __channel__,
action = inspect.stack()[0][3],
title = ">> Página siguiente",
url = urlparse.urljoin( item.url, "/" + next_page_url )
)
)
sin embargo me he quedado pescando XD porque ese si que va y el mio no??? en el codigo fuente por ejemplo pone lo siguiente href="cartelera/2">2</a></li><li> , o estoy ciega o es que yo veo que lo logico era que ese funcionara mas que el de title siguiente, cuando esto se cuentra en la pagina dos por ejemplo si sacamos el codigo fuente, por otro lado este codigo en el que se importa a que es debido? y este codigo de inspect atack, el de url si lo he visto en otro pero por ejemplo la "/" +nex page url no lo habia visto en otros codigos.
, action="findvideos" , title=title , url=urlparse.urljoin(item.url,next_page_url), folder=True ) )
porque cambia esta parte, y la action pasa inspect.stack()[0][3],, el title si lo entiendo porque es el nombre que recibirá esa sección de pagina siguiente,porque la urlcambia apartir de aqui: item.url, "/" + next_page_url ) y forlder porque se va entiendo que forlder es la carpeta, en donde por ejemplo tenemos un numero x de contenido, por ejemplo generos, año etc.
aquí esta.
https://drive.google.com/file/d/0Bxp_K- ... dvb1U/view
https://drive.google.com/file/d/0Bxp_K- ... tSX0E/view
pd; gracias Robalo, Cmos, seitan por ayudarme tanto. os dejo el link para que veais en que me quede. Tambien segui tu consejo Cmos, muchas gracias, ahora capta mejor los titulos.