acg456漫画网站爬虫

最新推荐文章于 2024-09-14 09:38:25 发布

爬到你心上

最新推荐文章于 2024-09-14 09:38:25 发布

阅读量8.4w

点赞数 1

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/weixin_38310652/article/details/89008872

版权

python 专栏收录该内容

10 篇文章 0 订阅

订阅专栏


import requests
import json
from urllib import request
import os
import time

for pn in range(1,182):                             #共1-100章
    pn = '%03d' %pn                                #三位数补零
    url = 'http://www.acg456.com/ajax/Common.ashx?op=getPics&cid=1810&serial=&path=%s' % pn #取得每一章网页
    #print(url)
    res = requests.get(url)
    #print(res.text)
    jsonfile = json.loads(res.text)  #字串转json格式
    #print(jsonfile)
    allpic = jsonfile['data']       #只取data的资料

    os.mkdir(pn)   #创建每一里的目录
    time.sleep(10)

    n = 1
    for i in allpic:
        request.urlretrieve(i,'%s\\%s.jpg' %(pn,n))  #i是图片网址
        n = n + 1

print('程式已执行结束')