多任务异步协程下载的 io 操作其实不是多个 Task 一起进行下载的,而是遇到阻塞的时候进行下一个 Task 的阻塞,将阻塞在时序上进行重叠
定义一个协程函数,协程函数中的阻塞实际是人为设定的 await asyncio.sleep(2)
,await
手动实现挂起,函数实现 URL 请求,请求成功后进行持续化存储
async def get_down(url):
print('正在请求',url)
# 执行一个 Task 遇到阻塞操作 则使用 await 手动挂起,程序会去执行另一个 Task
# 相当于将每个 Task 阻塞的 2s 时序上实现了重叠 本来要 6s 实际只要 2s
await asyncio.sleep(2)
# 在异步协程中如果只是同步模块代码,则无法实现异步
# requests 模块不支持异步操作
response=requests.get(url)
file_name=url.split('/')[-1]
with open(file_name,'wb') as fp:
fp.write(response.content)
将多个下载任务封装成 future 对象:
task=asyncio.ensure_future(c)
stasks.append(task)
启动事件循环,再将 future 对象列表注册到事件循环当中
loop=asyncio.get_event_loop()
# 有多个 Task 对象时不能直接把一个 Task 列表放在 loop.run_until_complete() 参数里
# 而要使用 asyncio.wait() 把 Task 列表封装到 wait 中
loop.run_until_complete(asyncio.wait(stasks))
这里需要注意,将 future 对象列表注册到事件循环中,要用 asyncio.wait
封装,不然就会报错:future = tasks.ensure_future(future, loop=self)、loop.run_until_complete(stasks)、raise TypeError('An asyncio.Future, a coroutine or an awaitable is ' TypeError: An asyncio.Future, a coroutine or an awaitable is required
task 对象也类似
实际用时就是每张图片请求、持续化存储时间加上单位阻塞时间,如果要实现多张图片请求同时持续化存储,可以将 requests
模块配合线程池实现异步,只需要一张图片请求和存储的时间
#练习代码
import time
import requests
import asyncio
async def get_down(url):
print('正在请求',url)
# 执行一个 Task 遇到阻塞操作 则使用 await 手动挂起,程序会去执行另一个 Task
# 相当于将每个 Task 阻塞的 2s 时序上实现了重叠 本来要 6s 实际只要 2s
await asyncio.sleep(2)
# 在异步协程中如果只是同步模块代码,则无法实现异步
response=requests.get(url)
file_name=url.split('/')[-1]
with open(file_name,'wb') as fp:
fp.write(response.content)
print('下载完成',file_name)
start_time=time.time()
url_list=[
'https://img2.woyaogexing.com/2022/05/17/d1e286f4045c4a02a8f072484d7d2012!400x400.jpeg',
'https://img2.woyaogexing.com/2022/05/17/80f6c1f7daa64f5ab84a4e2e0476a9b2!400x400.jpeg',
'https://img2.woyaogexing.com/2022/05/17/c74afd1a30a64caa8ae8584d720ce76e!400x400.jpeg'
]
# 任务列表,存放多个任务对象
stasks=[]
for url in url_list:
c=get_down(url)
task=asyncio.ensure_future(c)
stasks.append(task)
loop=asyncio.get_event_loop()
# 有多个 Task 对象时不能直接把一个 Task 列表放在 loop.run_until_complete() 参数里
# 而要使用 asyncio.wait() 把 Task 列表封装到 wait 中
loop.run_until_complete(asyncio.wait(stasks))
print(time.time()-start_time)