python爬取下载有妖气漫画网站免费漫画

首先获取所有免费漫画的信息

进入开发者模式,由于漫画是采取异步访问的方式,我们直接点击XHR,查看里面的list,可以获得所有漫画的信息
在这里插入图片描述
我们尝试在网页访问里面的Headers里面的URL,
在这里插入图片描述
得到在这里插入图片描述
显然,网页采取了反爬虫机制,这边我们要设置代理,伪装成浏览器去访问,这边要添加一些头部信息在这里插入图片描述
代码如下:

  headers = {
        "Request Method": "POST",
        "Cookie": "U17SID=pfp8vufd21t6vd87hppch4f3p9c19ku3; index_mobile_do_ad=1; Hm_lvt_9aa72b7e4e92f182872acd1c8031f141=1538056312; UM_distinctid=1661b4cdea43aa-0b0eb36b6ca7fb-3a614f0b-100200-1661b4cdea510; CNZZDATA30088157=cnzz_eid%3D421910364-1538051250-null%26ntime%3D1538051250; Hm_lpvt_9aa72b7e4e92f182872acd1c8031f141=1538056358; _cnzz_CV30031742=%E7%94%A8%E6%88%B7%E7%B1%BB%E5%9E%8B%7C%E6%B8%B8%E5%AE%A2%7C1538056379431; CNZZDATA30031742=cnzz_eid%3D937536403-1538052583-http%253A%252F%252Fwww.u17.com%252F%26ntime%3D1538052583",
    }
    for j in range(1, 406):
        data = {
            "data[is_vip]": "no",
            "data[theme_id]": "no",
            "data[page_num]": j,
            "data[group_id]": "no",
            "data[accredit]": "no",
            "data[read_mode]": "no",
        }
        url = "http://www.u17.com/comic/ajax.php?mod=comic_list&act=comic_list_new_fun&a=get_comic_list"
        response = requests.post(url, headers=headers, data=data)
        content = json.loads(response.text)

接着获取所有章节/图片的资源

这边我绕了点弯路,点了一本漫画进去找了半天没找到,是要再加点进去看漫画的时候才会同时给出章节信息和图片信息在这里插入图片描述
在浏览器中可直接访问可以直接爬取,下面附上我的代码
https://download.csdn.net/download/weixin_42478037/10950188

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值