book118抓取器(玩具,上大学为了看盗版书写的)

from urllib import request
from urllib import parse
import urllib
import ssl
import time
import json

def getImgUrlAll(furl,sn,img,f,page_count):
    furl=furl
    sn=sn
    img=img
    f=f
    page_count=page_count
    img_urls_id=[] #文档中每页的地址
     

    img_urls_id.append(img)
    for indexs in range(sn,page_count):
        json_url='https://view45.book118.com/PW/GetPage?f='+f+'&img='+img+'&isMobile=false&readLimit=z1SQwiTQU00uxfwJSFd6tA==&sn='+str(sn)+'&furl='+furl #请求获得文档地址的链接地址 
        context=ssl._create_unverified_context()
        try:
            url_response=urllib.request.urlopen(json_url,context=context)
            json_data=url_response.read()
            json_data=json.loads(json_data)
            img=json_data['NextPage']
            sn=json_data['PageIndex']
            img_ur
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值