Creo que tenemos la solución, sólo nos falta, al menos a mi

, una estrategia.
La url válida la podemos extraer de las cookies sin tener que buscar datos en la página ya que no están y tendríamos que tirar de DOM para que rellenara lo que nos falta.
En la función play u otra nueva si se hace muy grade, cargaríamos las cookies tal que así:
Código: Seleccionar todo
cookie = scrapertools.get_header_from_response(item.url, header_to_get="set-cookie", headers = ENLACESPEPITO_REQUEST_HEADERS)
Con los datos contenidos en la variable 'cookie' tenemos todo lo necesario para extraer la url.
Os pongo un ladrillo y a ver quién ve una buena extrategia
Código: Seleccionar todo
+++++++++++++++++++++++++++++++++++++++++++++++++++
(no nos interesa)
+++++++++++++++++++++++++++++++++++++++++++++++++++
_ga=deleted; expires=Thu, 01-Jan-1970 00:00:01 GMT; path=/; domain=enlacespepito.com,
---------------------------------------------------
+++++++++++++++++++++++++++++++++++++++++++++++++++
(no nos interesa)
+++++++++++++++++++++++++++++++++++++++++++++++++++
epsesion=2619415366824b74448b2750798b4268; path=/; domain=.enlacespepito.com,
---------------------------------------------------
+++++++++++++++++++++++++++++++++++++++++++++++++++
(no nos interesa)
+++++++++++++++++++++++++++++++++++++++++++++++++++
visita=1; expires=Fri, 25-Jul-2014 19:01:32 GMT; path=/; domain=enlacespepito.com,
---------------------------------------------------
+++++++++++++++++++++++++++++++++++++++++++++++++++
class para el enlace válido:
+++++++++++++++++++++++++++++++++++++++++++++++++++
143290a1347f9a7ec8506927aba932ea=Ny1hQHphMzlkZmU2NGI4YjcyMjY4MmI0M2E1MmVjZDE1OTkzMA%3D%3D; expires=Fri, 25-Jul-2014 18:51:36 GMT; path=/; domain=enlacespepito.com,
decode64 = [7-a@za39dfe64b8b722682b43a52ecd159930]
---------------------------------------------------
+++++++++++++++++++++++++++++++++++++++++++++++++++
class grupo 1: (no nos interesa)
+++++++++++++++++++++++++++++++++++++++++++++++++++
d093aa9e0fb47a58eaf159f4ed35b519=PHN0eWxlPi54ODU3M2Y0YTViZWVkMTdiZjA2NjRjNjhmOGQyY2M4MWYuejFlZGQyOTU3ZDAzMjIzNzAyOGM1MDA2NzBiOWJmN2EzLmYxMmFiMjA3YmMyZmEzYjM0ODYyODkzY2IxMmUxZGM4Nzwvc3R5bGU%2B; expires=Fri, 25-Jul-2014 18:51:36 GMT; path=/; domain=enlacespepito.com,
decode64 = [<style>
.x8573f4a5beed17bf0664c68f8d2cc81f.z1edd2957d032237028c500670b9bf7a3.f12ab207bc2fa3b34862893cb12e1dc87
</style>]
---------------------------------------------------
+++++++++++++++++++++++++++++++++++++++++++++++++++
class grupo 2: (no nos interesa)
+++++++++++++++++++++++++++++++++++++++++++++++++++
0f467aa8429fa1112c600ac1d10b7f03=PHN0eWxlPi5hOThhZWMxMzliMTE0ZDY5MmUxN2JiZTNkZmYwM2Y0YTMucTJjOWZlZDg4Mzk3MTdiZjQ0ZmM5OWZjNmNhMGZiNjNhLnphMzlkZmU2NGI4YjcyMjY4MmI0M2E1MmVjZDE1OTkzMDwvc3R5bGU%2B; expires=Fri, 25-Jul-2014 18:51:36 GMT; path=/; domain=enlacespepito.com,
decode64 = [<style>
.a98aec139b114d692e17bbe3dff03f4a3.q2c9fed8839717bf44fc99fc6ca0fb63a.za39dfe64b8b722682b43a52ecd159930
</style>]
---------------------------------------------------
+++++++++++++++++++++++++++++++++++++++++++++++++++
class grupo 1 + href grupo 1:
+++++++++++++++++++++++++++++++++++++++++++++++++++
a3c718f0ff73acbb7ffd74ccac91c74e=PHNjcmlwdD5wOW0xPVsieDg1NzNmNGE1YmVlZDE3YmYwNjY0YzY4ZjhkMmNjODFmIiwiZjEyYWIyMDdiYzJmYTNiMzQ4NjI4OTNjYjEyZTFkYzg3IiwiemEzOWRmZTY0YjhiNzIyNjgyYjQzYTUyZWNkMTU5OTMwIl07eTlzOT1bImRjMmEzM2VhOTJkOTMzNTNhYzMyYjZkMjZlZDNmMGRiL2RmNjNiOTIzYTYzMTNjNTM2ZTMzOWMzYjJlYWUzMzZjZDEzM2YzYjJkOTM5NjMzZmViM2QwYTE1MzUzZjAyMWQzOWYzY2IwMmZkM2UzNjkwZjAzM2UzMWEzNTJmZWMyMzAiLCJ5YzJ5MzNleTkyeTk3NzU3eWM3N2I5eTI5ZXk3ZjB5Yi95Zjk3Yjk3M3k5Nzk3YzUzOWU3NzljM2I3ZXllNzc5Y3k5MzdmN2I3eTk3OTk3M2ZlYjd5MHk5NTc1N2YwNzl5NzlmN2NiMDJmeTdlNzk5MGYwMzdlMzl5NzU3ZmVjMjcwIiwiZGMyYTMzZXo5MmQ5NDg1NGFjODdiNmQyNmVkOGYwZGIvZGY2OGI5NzNhNjgxOGM1MzZlODg5YzNiN2VhZTg4NmNkMTM0ZjRiN2Q5ODk2NDNmZWI0ZDBhMTU4NTRmMDcxZDQ5ZjRjYjAyZmQ4ZTg2OTBmMDM0ZTMxYTg1N2ZlYzI0MCJdO2Zvcih0OGU3PTA7dDhlNzxwOW0xLmxlbmd0aDt0OGU3Kyspe24xeTc9eTlzOVt0OGU3XS5zcGxpdCgiQCIpO2ZvcihnMWwxPW4xeTcubGVuZ3RoLTE7IGcxbDE%2BPTA7IGcxbDEtLSl7eDN5OT0kKCI8YT48L2E%2BIik7eDN5OS5hdHRyKCJocmVmIixsM3UzK24xeTdbZzFsMV0rIi5odG1sIik7eDN5OS5hdHRyKCJjbGFzcyIsInk5ajEgIitwOW0xW3Q4ZTddKTt4M3k5LmF0dHIoInRhcmdldCIsIl9ibGFuayIpO3gzeTkuYXR0cigicmVsIiwibm9mb2xsb3ciKTt4M3k5LnRleHQoIlZlciIpOyQoIiN2Nm02IikuYWZ0ZXIoeDN5OSk7fX08L3NjcmlwdD4%3D; expires=Fri, 25-Jul-2014 18:51:36 GMT; path=/; domain=enlacespepito.com,
parte 1:
decode64 = [<script>
p9m1=["x8573f4a5beed17bf0664c68f8d2cc81f","f12ab207bc2fa3b34862893cb12e1dc87","za39dfe64b8b722682b43a52ecd159930"];y9s9=["dc2a33ea92d93353ac32b6d26ed3f0db/df63b923a6313c536e339c3b2eae336cd133f3b2d939633feb3d0a15353f021d39f3cb02fd3e3690f033e31a352fec230","yc2y33ey92y97757yc77b9y29ey7f0yb/yf97b973y9797c539e779c3b7eye779cy937f7b7y979973feb7y0y95757f079y79f7cb02fy7e7990f037e39y757fec270","dc2a33ez92d94854ac87b6d26ed8f0db/df68b973a6818c536e889c3b7eae886cd134f4b7d989643feb4d0a15854f071d49f4cb02fd8e8690f034e31a857fec240"];for(t8e7=0;t8e7<p9m1.length;t8e7++){n1y7=y9s9[t8e7].split("@");for(g1l1=n1y7.length-1; g1l1>
</script>]
parte 2:
decode64 = [=0; g1l1--){x3y9=$("]
parte 3:
decode64 = [;x3y9.attr("href",l3u3+n1y7[g1l1]+".html");x3y9.attr("class","y9j1 "+p9m1[t8e7]);x3y9.attr("target","_blank");x3y9.attr("rel","nofollow");x3y9.text("Ver");$("#v6m6").after(x3y9);}}]
---------------------------------------------------
+++++++++++++++++++++++++++++++++++++++++++++++++++
class grupo 2 + href grupo 2:
+++++++++++++++++++++++++++++++++++++++++++++++++++
a2dcf11f4227bca47df1aa925be6b1e3=PHNjcmlwdD4gcTZyOT1bInEyYzlmZWQ4ODM5NzE3YmY0NGZjOTlmYzZjYTBmYjYzYSIsImE5OGFlYzEzOWIxMTRkNjkyZTE3YmJlM2RmZjAzZjRhMyIsInoxZWRkMjk1N2QwMzIyMzcwMjhjNTAwNjcwYjliZjdhMyJdO3E5Yzg9WyJkYzJhMzNlYTkyZDkyODUyYWM4MmI4ZDI4ZWQ4ZjBkYi9kZjg4YjkyM2E4ODE4YzUzOGU4ODljM2IyZWFlODg4Y2QxMzJmMmIyZDk4OTgyM2ZlYjJkMGExNTg1MmYwMjFkMjlmMmNiMDJmZDhlODg5MGYwMzJlMzFhODUyZmVjMjIwIiwiaWE0YTQ0ZWE2NGk2NDg1NGFhODdiNmk0NmVpOGYwaWIvaWY2OGI2NzRhNjgxOGE1NDZlODg2YTRiN2VhZTg4NmFpMTQ0ZjRiN2k2ODY2NDRmZWI0aTBhMTU4NTRmMDcxaTQ2ZjRhYjA0Zmk4ZTg2NjBmMDQ0ZTQxYTg1N2ZlYTQ0MCIsImRyMmE4OGVhOTJkOTg4ODhhcjg3YjNkMjNlZDhmMGRiL2RmMzhiOTc4YTM4MThyODgzZTg4OXI4YjdlYWU4ODNyZDE4OGY4YjdkOTg5Mzg4ZmViOGQwYTE4ODg4ZjA3MWQ4OWY4cmIwMmZkOGU4MzkwZjA4OGU4MWE4ODdmZXIyODAiXTtmb3IoeTllMT0wO3k5ZTE8cTZyOS5sZW5ndGg7eTllMSsrKXtlN2MxID0gcTljOFt5OWUxXS5zcGxpdCgiQCIpO2ZvcihkMW84PWU3YzEubGVuZ3RoLTE7IGQxbzg%2BPTA7IGQxbzgtLSl7ejdnMyA9ICQoIjxhPjwvYT4iKTt6N2czLmF0dHIoImhyZWYiLGwzdTMrZTdjMVtkMW84XSsiLmh0bWwiKTt6N2czLmF0dHIoImNsYXNzIiwieTlqMSAiK3E2cjlbeTllMV0pO3o3ZzMuYXR0cigidGFyZ2V0IiwiX2JsYW5rIik7ejdnMy5hdHRyKCJyZWwiLCJub2ZvbGxvdyIpO3o3ZzMudGV4dCgiVmVyIik7JCgiI3Y2bTYiKS5hZnRlcih6N2czKTt9fTwvc2NyaXB0Pg%3D%3D; expires=Fri, 25-Jul-2014 18:51:36 GMT; path=/; domain=enlacespepito.com,
parte 1:
decode64 = [<script>
q6r9=["q2c9fed8839717bf44fc99fc6ca0fb63a","a98aec139b114d692e17bbe3dff03f4a3","z1edd2957d032237028c500670b9bf7a3"];q9c8=["dc2a33ea92d92852ac82b8d28ed8f0db/df88b923a8818c538e889c3b2eae888cd132f2b2d989823feb2d0a15852f021d29f2cb02fd8e8890f032e31a852fec220","ia4a44ea64i64854aa87b6i46ei8f0ib/if68b674a6818a546e886a4b7eae886ai144f4b7i686644feb4i0a15854f071i46f4ab04fi8e8660f044e41a857fea440","dr2a88ea92d98888ar87b3d23ed8f0db/df38b978a3818r883e889r8b7eae883rd188f8b7d989388feb8d0a18888f071d89f8rb02fd8e8390f088e81a887fer280"];for(y9e1=0;y9e1<q6r9.length;y9e1++){e7c1 = q9c8[y9e1].split("@");for(d1o8=e7c1.length-1; d1o8>
</script>]
parte 2:
decode64 = [=0; d1o8--){z7g3 = $("
<a></a>
");z7g3.attr("href",l3u3+e7c1[d1o8]+".html");z7g3.attr("class","y9j1 "+q6r9[y9e1]);z7g3.attr("target","_blank");z7g3.attr("rel","nofollow");z7g3.text("Ver");$("#v6m6").after(z7g3);}}]
---------------------------------------------------
+++++++++++++++++++++++++++++++++++++++++++++++++++
style="display: inline;" para el class de la
cookie 143290a1347f9a7ec8506927aba932ea:
(no nos interesa)
+++++++++++++++++++++++++++++++++++++++++++++++++++
d85d7a6794a8489c17f8793a1adc7a30=PHNjcmlwdD51MmU1PSQuY29va2llKCIxNDMyOTBhMTM0N2Y5YTdlYzg1MDY5MjdhYmE5MzJlYSIpLnNwbGl0KCJAIik7JCgiLiIrdTJlNVsxXSkuc2hvdygpO3MxeDE9dTJlNVswXS5zcGxpdCgiLCIpLGIzeDI9MDskKCIuIit1MmU1WzFdICkuZWFjaChmdW5jdGlvbigpe3U1ZDEgPSBzMXgxW2IzeDJdLnNwbGl0KCItIik7bzF0OD1uZXcgUmVnRXhwKHExdTIrIlwvKFteXC5dKikuaHRtbCIsImlnIik7ejh3MT0obzF0OC5leGVjKCQodGhpcykuYXR0cigiaHJlZiIpKSlbMV0uc3BsaXQoIiIpO3o4dzFbdTVkMVswXV09dTVkMVsxXTskKHRoaXMpLmF0dHIoImhyZWYiLGwzdTMrejh3MS5qb2luKCIiKSsiLmh0bWwiKTtiM3gyKys7fSk7JCgiLiIrdTJlNVsxXSkubW91c2Vkb3duKGZ1bmN0aW9uKGUpe2lmKGUud2hpY2g9PTMpe2FsZXJ0KCJObyBjb3BpZXMgZWwgZW5sYWNlLCBlc28gbm8gdmEgYSBmdW5jaW9uYXIgOilcblRpZW5lcyBxdWUgaGFjZXIgY2xpY2sgc29icmUgZWwsIGdyYWNpYXMuIik7fX0pOyQoIiN2Nm02IikuaGlkZSgpOzwvc2NyaXB0Pg%3D%3D; expires=Fri, 25-Jul-2014 18:51:36 GMT; path=/; domain=enlacespepito.com
decode64 = [<script>
u2e5=$.cookie("143290a1347f9a7ec8506927aba932ea").split("@");$("."+u2e5[1]).show();s1x1=u2e5[0].split(","),b3x2=0;$("."+u2e5[1] ).each(function(){u5d1 = s1x1[b3x2].split("-");o1t8=new RegExp(q1u2+"\/([^\.]*).html","ig");z8w1=(o1t8.exec($(this).attr("href")))[1].split("");z8w1[u5d1[0]]=u5d1[1];$(this).attr("href",l3u3+z8w1.join("")+".html");b3x2++;});$("."+u2e5[1]).mousedown(function(e){if(e.which==3){alert("No copies el enlace, eso no va a funcionar :)\nTienes que hacer click sobre el, gracias.");}});$("#v6m6").hide();
</script>]
---------------------------------------------------
Se tendría que recoger el valor de '
class para el enlace válido' después de la arroba para compararlo con los valores del primer array de '
class grupo 1 + href grupo 1' y '
class grupo 2 + href grupo 2' de la '
parte 1' y nos quedarríamos con el valor del mismo index del segundo array.
Con ese dato completaríamos la url válida.
"
enlacespepito.com/"+dato+".html"
Alguien se anima?