从豆瓣爬取并下载对应关键字的全部图片（以周杰伦为例）

最新推荐文章于 2022-05-09 20:02:51 发布

Steven--Lee

最新推荐文章于 2022-05-09 20:02:51 发布

阅读量7.7w

点赞数

分类专栏： python3.6 文章标签：爬取 python 图片下载豆瓣代码

本文链接：https://blog.csdn.net/momDIY/article/details/99497171

版权

python3.6 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

源码

import requests
import json

def download(src, id):
    dir = './' + str(id) + '.jpg'
    try:
        pic = requests.get(src, timeout=10)
    except requests.exceptions.ConnectionError:
        # print 'error, %d 当前图片无法下载', %id
        print('图片无法下载')
    fp = open(dir, 'wb')
    fp.write(pic.content)
    fp.close()

def loop_request(total, text):
    for i in range(0, total, 20):
        url = 'https://www.douban.com/j/search_photo?q=' + text + '&limit=20&start=' + str(i)
        html = requests.get(url).text  # 得到返回结果
        response = json.loads(html, encoding='utf-8')  # 将JSON格式转换成Python对象
        for image in response['images']:
            print('downloading ' + image['src'])
            # 查看当前下载的图片网址
            download(image['src'], image['id'])  # 下载一张图片

def get_count(text):
    url = 'https://www.douban.com/j/search_photo?q=' + text + '&limit=20&start=1'
    html = json.loads(requests.get(url).text, encoding='utf-8')
    print(html)
    print(html['total'])
    loop_request(html['total'], text)

get_count('周杰伦')