Página 1 de 1

Fallo listado seriesblanco y solucion

Publicado: 27 Ene 2017, 22:57
por Dragonfire
Hola a todos,

Desde hace algún tiempo he detectado un fallo al entrar en el listado alfabetico de series. Lo detecté antes de actualizar a la versión 4.2.0 y ahora, en esta última versión, sigue existiendo. La primera serie que se recupera del listado, trae la imagen y la url erronea. Curiosamente revisando he comprobado que se trae la imagen y la url de uno de los usuarios online de la web de la que hablamos :?
No pasa siempre, ahora que se que son los datos de un usuario, supongo que cuando no hay ninguno registrado en la web online, funciona correctamente.

He comprobado que la cuestión está en la función "extractSeriesFromData" y trasteando con el "re.findall" finalmente no he tenido narices de hacer que funcionara correctamente :oops: . Así que he optado por delimitarle las posibilidades para que no cayera en enganchar los datos de los usuarios, añadiendo delante de la línea:

Código: Seleccionar todo

data = data[data.find(">Listado de Series"):]
Ahora funciona correctamente, aunque seguro que hay opciones más elegantes.



Un saludo.

Re: Fallo listado seriesblanco y solucion

Publicado: 28 Ene 2017, 13:18
por Lortropic
Puedes dar un ejemplo en el que pase eso?

Re: Fallo listado seriesblanco y solucion

Publicado: 28 Ene 2017, 13:44
por Dragonfire
Yo lo detecté al entrar por "Listado alfabético". Si entras en cualquier letra, la primera serie del listado tendra mal los datos de imagen y url, así que si quieres ver sus temporadas o episodios saldrá vacio. Por lo que he comprobado esto no pasa siempre, solo cuando la web tiene usuarios registrados online, que son los datos que mezcla con la 1a serie de la lista.

Le he dado otra vuelta de tuerca y visto que el problema se puede solucionar quitando simplemente la opción "re.DOTALL" (sin tener que añadir lo que comentaba en el otro post), con lo que la línea del re.findall quedaría así:

Código: Seleccionar todo

shows = re.findall("<a.+?href=['\"](?P<url>[^'\"]+)[^<]*<img[^>]*src=['\"](?P<img>http[^'\"]+).*?(?:alt|title)=['\"](?P<name>[^'\"]+)", data, re.MULTILINE)
(Adjunto mi fichero, que incluye los cambios de github hasta día de hoy)

Te dejo unas fotos para que veas lo que ocurre (ahora he visto que también pasa entrando en "Todas las series"):
ImagenImagen

Re: Fallo listado seriesblanco y solucion

Publicado: 31 Ene 2017, 20:26
por marioeivissa
bingoooo!!!funciona perfectamente
eres un crack :D