python网络爬虫笔记07:多线程异步协程

本文介绍了Python协程的基本理论,包括同步/异步睡眠的区别,并展示了官方推荐的多线程异步协程写法。通过实战案例,阐述了如何运用异步协程进行图片和百度小说的爬取,强调了在Python 3.8后使用asyncio.create_task()创建任务以及处理aiohttp和aiofiles的细节。
摘要由CSDN通过智能技术生成

目录

1. 协程理论与实验案例

1.1 基础理论

1.2 同步/异步睡眠

1.3 官方推荐多线程异步协程写法

2 异步协程爬虫实战

2.1 爬取图片实战代码

2.2 爬取百度小说


1. 协程理论与实验案例

1.1 基础理论

程序处于阻塞状态的情形包含以下几个方面:

  • input():等待用户输入
  • requests.get():网络请求返回数据之前
  • 当程序处理IO操作时,线程都处于阻塞状态
  • time.sleep():处于阻塞状态

协程的逻辑是当程序遇见IO操作时,可以选择性的切换到其他任务上;协程在微观上任务的切换,切换条件一般就是IO操作;在宏观上,我们看到的是多个任务都是一起执行的;上方的一切都是在在单线程的条件下,充分的利用单线程的资源。

要点梳理:

  • 函数被asyn修饰,函数被调用时,它不会被立即执行;该函数被调用后会返回一个协程对象。
  • 创建一个协程对象:构建一个asyn修饰的函数,然后调用该函数返回的就是一个协程对象
  • 任务对象是一个高级的协程对象,
import 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小薛引路

喜欢的读者,可以打赏鼓励一下

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值