Python 多线程下载图片

多线程下载图片

参考链接:

展示

Python 多线程下载图片~

python简单爬虫练习,python版本3.7,全部用标准库实现,线程池使用concurrend的ThreadPoolExecutor,下载库使用urllib

创建文件夹函数

def CrePath():
    if not os.path.exists(fn):
        os.mkdir(fn)

python-pyinstaller打包后对获取路径的修复方法:
参考连接:python-pyinstaller、打包后获取路径

fn = f'{os.path.dirname(os.path.realpath(sys.argv[0]))}/{folder}'
    CrePath()

多线程主体结构

from concurrent.futures import ThreadPoolExecutor

def main(page_num):
    datas = get_page(page_num)
    for link in get_images(datas):
        done = pool.submit(saving_img, link)
        done.add_done_callback(huitiao)
        
if __name__ == '__main__':
	
	# 设置5个线程
    pool = ThreadPoolExecutor(5)
	
	# 遍历获取下载link,并添加到线程池
    for page_num in range(0, 2):
        main(page_num)

    pool.shutdown(wait=True)

获取数据函数

def get_page(page_num):

    params = {
        ...
    }

    url = 'https://so.toutiao.com/search?' + parse.urlencode(params)

    try:
        req = request.Request(url, headers=headers)
        resp = request.urlopen(req)
        if resp.getcode() == 200:
            return resp.read().decode()
    except error.HTTPError as e:
        print('出错了:' + e.code)
        return None

处理获取到的数据
此处的yield,使函数变为了生成器,这块知识,有必要课外补习一下,是python的特点之一~

def get_images(datas):
	# 可以对获取到的数据先存起来,模拟处理一次
    # with open("E:\\Codes\\python\\jiepai_datas.txt",
    #           mode='r',
    #           encoding='utf-8') as f:
    #     images = json.loads(f.read()).get('rawData').get('data')
    images = json.loads(datas).get('rawData').get('data')
    for image in images:
        link = image.get('img_url')
        yield link

下载图片
这边使用urllib.urlretrieve()下载链接到本地路径
注意:
这次的例子,下载图片比较简单, 不需带referer参数,如果需要带参数,暂时还是建议使用request会较简单。因为在这个urllib函数这里不知道如何带header、referer等参数请求。

def saving_img(link):
    request.urlretrieve(link, fn + f'/jiepai-{name}.jpg')

绑定的回调函数
注意:回调函数必须要带一个对象参数future

def huitiao(future):
    global name
    print(f'-------正在打印第{name}张图片')
    name += 1

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值