Python 多线程下载图片

最新推荐文章于 2024-08-26 10:29:52 发布

HarryFooty

最新推荐文章于 2024-08-26 10:29:52 发布

阅读量468

点赞数

分类专栏：笔记文章标签： python 批量下载图片

本文链接：https://blog.csdn.net/weixin_44500833/article/details/118147220

版权

笔记专栏收录该内容

64 篇文章 1 订阅

订阅专栏

多线程下载图片

参考链接：

展示

Python 多线程下载图片~

python简单爬虫练习，python版本3.7，全部用标准库实现，线程池使用concurrend的ThreadPoolExecutor，下载库使用urllib

创建文件夹函数

def CrePath():
    if not os.path.exists(fn):
        os.mkdir(fn)

python-pyinstaller打包后对获取路径的修复方法：
参考连接：python-pyinstaller、打包后获取路径

fn = f'{os.path.dirname(os.path.realpath(sys.argv[0]))}/{folder}'
    CrePath()

多线程主体结构

from concurrent.futures import ThreadPoolExecutor

def main(page_num):
    datas = get_page(page_num)
    for link in get_images(datas):
        done = pool.submit(saving_img, link)
        done.add_done_callback(huitiao)
        
if __name__ == '__main__':
	
	# 设置5个线程
    pool = ThreadPoolExecutor(5)
	
	# 遍历获取下载link，并添加到线程池
    for page_num in range(0, 2):
        main(page_num)

    pool.shutdown(wait=True)

获取数据函数

def get_page(page_num):

    params = {
        ...
    }

    url = 'https://so.toutiao.com/search?' + parse.urlencode(params)

    try:
        req = request.Request(url, headers=headers)
        resp = request.urlopen(req)
        if resp.getcode() == 200:
            return resp.read().decode()
    except error.HTTPError as e:
        print('出错了:' + e.code)
        return None

处理获取到的数据
此处的yield，使函数变为了生成器，这块知识，有必要课外补习一下，是python的特点之一~

def get_images(datas):
	# 可以对获取到的数据先存起来，模拟处理一次
    # with open("E:\\Codes\\python\\jiepai_datas.txt",
    #           mode='r',
    #           encoding='utf-8') as f:
    #     images = json.loads(f.read()).get('rawData').get('data')
    images = json.loads(datas).get('rawData').get('data')
    for image in images:
        link = image.get('img_url')
        yield link

下载图片
这边使用urllib.urlretrieve()下载链接到本地路径
注意：
这次的例子，下载图片比较简单，不需带referer参数，如果需要带参数，暂时还是建议使用request会较简单。因为在这个urllib函数这里不知道如何带header、referer等参数请求。

def saving_img(link):
    request.urlretrieve(link, fn + f'/jiepai-{name}.jpg')

绑定的回调函数
注意：回调函数必须要带一个对象参数future

def huitiao(future):
    global name
    print(f'-------正在打印第{name}张图片')
    name += 1

HarryFooty

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录