python 异步下载图片_异步aiohttp + asyncio 下载图片

import requests, os, time

import aiohttp, asyncio

import hashlib

class Spider(object):

def __init__(self):

self.headers = {

'User-Agent':''}

self.num = 1

if 'pro' not in os.listdir('.'):

os.mkdir('pro')

self.path = os.path.join(os.path.abspath('.'),'pro')

os.chdir(self.path)# 进入文件下载路径

async def __get_content(self, link): # 传入的是图片链接

async with aiohttp.ClientSession() as session:

response =await session.get(link)

content = await response.read()

return content

def __get_img_links(self, page): # 获取图片链接

# 使用requests请求返回全部图片的链接,也就是一个列表

return 1,2 #

def __get_md5_path_name(self,url_name): # 把图片的URL传入进去,加密得到的字符串来做图片名称

cre_md5 = hashlib.md5()

utf_url_name = url_name.encode(encoding = 'utf-8')

cre_md5.update(utf_url_name)

return cre_md5.hexdigest()

async def __download_img(self, img):

content = await self.__get_content(img) # 获取图片的进制文件

file_name = self.__get_md5_path_name(img) # 获取到MD5名称

with open(file_name + '.jpg', 'wb') as f:

f.write(content)

print('下载第%s张图片成功' % self.num)

self.num +=1

def run(self):

start = time.time()

for x in range(1,101): # 下载一百页的图片就可以了,或者自己更改页数

links = self.__get_img_links(x) # 把那一页需要爬图片的链接传进去

tasks = [asyncio.ensure_future(self.__download_img(link)) for link in links]

loop = asyncio.get_event_loop()

loop.run_until_complete(asyncio.wait(tasks))

if self.num >= 10:# 测试速度使用,如需要下载多张图片可以注释这段代码

break

end = time.time()

print('共运行了%s秒'% (end - start))

def main():

spider = Spider()

spider.run()

if __name__ == '__main__':

main()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值