python爬取web漫画网站_Python抓取腾讯漫画,WebUI版

ac.qq.com的页面的漫画是flash,取了个巧,当时用ipad看的时候发现是可以看的(iOS可没有flash)。于是curl -vH "User-Agent: $ipadUA"请求ac.qq.com的时候,发现有302跳转,指向m.ac.qq.com,再用浏览器访问,发现跳转到了移动端的页面,这个页面没有flash,于是也有了后来提交的代码,修改ipad的UA,直接对ac.qq.com/xxxxx这样的地址进行请求,会跳转为m.ac.qq.com/xxx/xxx/id这样的地址,然后就可以用id参数解析了。不过对ac.qq.com/cf这个地址却无法跳转,只能加判断了,将跳转后的URL用正则判断一下。

于是果断开搞,利用移动端的地址下载漫画,发现页面上漫画是用js生成的,对比了一下URL规则与firebug抓到的页面请求到的json,发现这个js虽然是生成的,但是规则其实很好搞,并没有太复杂的加密过程。于是就看到代码中那段奇怪的j,k,m,那就是js的函数重写为python版,连变量名都没换。

顺便吐槽下腾讯,vip收费漫画居然只在前端页面有个验证,但是后端请求的JSON API和图片URL居然统统没有验证,可以直接下载VIP收费漫画。

命令行版的那个完成差不多了,加入了下载指定章节的功能,这周争取写个简单的GUI出来。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值