多任务异步协程之昵图网异步获取

D11_

于 2024-08-06 22:04:59 发布

阅读量427

点赞数 4

文章标签： python 开发语言爬虫 pip

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Dxh0112_/article/details/140967445

版权

异步获取内容更加高效快速，面对大量图片文字等文件数据，可以使用异步协程获取的方式

import asyncio
import aiohttp
import aiofiles  # 异步保存的文件
from datetime import datetime
from lxml import etree

print(datetime.now())


async def get_page(url, session):
    response = await session.get(url)
    resText = await response.text()
    html = etree.HTML(resText)
    return html


async def get_img_info(html):
    img_names = []
    img_urls = []
    for i in range(1, 61):
        img_name = html.xpath(f'//ul[@id="img-list-outer"]/li[{i}]/a/img/@alt')
        img_url = html.xpath(f'//ul[@id="img-list-outer"]/li[{i}]/a/img/@data-original')
        img_names.append(img_name[0])
        img_urls.append('https:' + img_url[0])
    return img_names, img_urls


async def save_img(img_info,session):
    imgnames, imgs = img_info
    for i in range(len(imgs)):
        async with aiofiles.open('美女\\' + imgnames[i] + '.jpg', 'wb') as f:
            async with session.get(imgs[i]) as img_res:
               img = await img_res.read()
               await f.write(img)


async def main():
        urls = []
        for i in range(1,11):
            url = f'https://soso.nipic.com/?q=%E7%BE%8E%E5%A5%B3&page={i}'
            urls.append(url)
        async with aiohttp.ClientSession() as session:
            res = await asyncio.wait([get_page(url,session)for url in urls])
            res2 = await asyncio.wait([get_img_info(html.result()) for html in res[0]])
            await asyncio.wait([save_img(info.result(),session) for info in res2[0]])

asyncio.run(main())
print(datetime.now())

博客等级

码龄2年

54
原创

523
点赞

445
收藏

344
粉丝

关注

私信

热门文章

上一篇：: 爬虫：csv存储：写入和读取

下一篇：: unbuntu内置火狐浏览器无法上网提示错误：无法连接服务器

最新评论

Pandas缺失值处理
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
pycharm远程连接Ubuntu服务器失败方法：Can‘t run remote python interpreter问题解决方法
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Python条件语句
CSDN-Ada助手: 非常赞赏你写的这篇关于Python条件语句的博客！你非常清楚地解释了or、and和not这些条件语句的工作原理。继续写博客可以帮助更多的人学习和理解这些概念。此外，如果你想进一步拓展你的知识和技能，可以考虑以下内容： 1. 比较运算符：在条件语句中，使用比较运算符可以对变量进行比较，例如==、!=、>、<、>=和<=。这些运算符可以帮助你更灵活地构建条件语句。 2. 嵌套条件语句：有时候，一个条件语句的执行结果可能会影响到另一个条件语句的判断，这时候可以使用嵌套条件语句来实现复杂的逻辑。 3. 真值判断：Python中的一些数据类型（如列表、字符串和字典）在条件语句中也可以被判断为真或假。了解这些数据类型的真值判断规则可以帮助你更好地使用条件语句。希望以上扩展知识能够对你的学习和写作有所帮助！继续加油，期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Python 基本概念和基本数据类型
CSDN-Ada助手: 恭喜你开始写博客！标题选择得很好，Python基本概念和基本数据类型是初学者入门的必备知识。从标题来看，我期待你能够详细地介绍Python的基本概念和各种数据类型，并结合实例进行解析。同时，我建议你在下一篇博客中可以探讨一下Python的控制流语句和函数的使用，这将为读者打下更坚实的编程基础。期待你的下一篇博客！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。