python使用协程_Python使用协程进行爬虫

关注公众号“轻松学编程”了解更多。

1、协程

协程,又称微线程,纤程。英文名Coroutine。

协程是啥 ??

首先我们得知道协程是啥?协程其实可以认为是比线程更小的执行单元。为啥说他是一个执行单元,因为他自带CPU上下文。这样只要在合适的时机,我们可以把一个协程切换到另一个协程,只要这个过程中保存或恢复 CPU上下文那么程序还是可以运行的。

通俗的理解:在一个线程中的某个函数,可以在任何地方保存当前函数的一些临时变量等信息,然后切换到另外一个函数中执行,注意不是通过调用函数的方式做到的,并且切换的次数以及什么时候再切换到原来的函数都由开发者自己确定。

协程和线程差异

最大的优势就是协程极高的执行效率,因为子程序切换不是线程切换,而是由程序自身控制,因此,没有线程切换的开销线程切换从系统层面远不止保存和恢复 CPU上下文这么简单。操作系统为了程序运行的高效性每个线程都有自己缓存Cache等等数据,操作系统还会帮你做这些数据的恢复操作。所以线程的切换非常耗性能。但是协程的切换只是单纯的操作CPU的上下文,所以一秒钟切换个上百万次系统都抗的住。

第二大优势协程就是不需要多线程的锁机制,因为只有一个线程,也不存在同时写变量冲突。

2、使用协程

1.使用greenlet + switch实现协程调度

'''

使用greenlet + switch实现协程调度

'''

from greenlet import greenlet

import time

def func1():

print("开门走进卫生间")

time.sleep(3)

gr2.switch() # 把CPU执行权交给gr2

print("飞流直下三千尺")

time.sleep(3)

gr2.switch()

pass

def func2():

print("一看拖把放旁边")

time.sleep(3)

gr1.switch()

print("疑是银河落九天")

pass

if __name__ == '__main__':

gr1 = greenlet(func1)

gr2 = greenlet(func2)

gr1.switch() # 把CPU执行权先给gr1

pass

输出:

开门走进卫生间

一看拖把放旁边

飞流直下三千尺

疑是银河落九天

2.使用gevent + sleep自动将CPU执行权分配给当前未睡眠的协程

'''

使用gevent + sleep自动将CPU执行权分配给当前未睡眠的协程

'''

import gevent

def func1():

gevent.sleep(1)

print("大梦谁先觉")

gevent.sleep(13)

print("1:over")

pass

def func2():

gevent.sleep(3)

print("平生我自知")

gevent.sleep(9)

print("2:over")

pass

def func3():

gevent.sleep(5)

print("草堂春睡足")

gevent.sleep(5)

print("3:over")

pass

def func4():

gevent.sleep(7)

print("窗外日迟迟")

gevent.sleep(1)

print("4:over")

pass

def simpleGevent():

gr1 = gevent.spawn(func1)

gr2 = gevent.spawn(func2)

gr3 = gevent.spawn(func3)

gr4 = gevent.spawn(func4)

gevent.joinall([

gr1, gr2, gr3, gr4

])

if __name__ == '__main__':

simpleGevent()

pass

输出:

大梦谁先觉

平生我自知

草堂春睡足

窗外日迟迟

4:over

3:over

2:over

1:over

3.通过monkey调度

'''

使用gevent + monkey.patch_all()自动调度网络IO协程

'''

import gevent

import requests

import time

from gevent import monkey

def getPageText(url, order=0):

print("No%d:%s请求开始..." % (order, url))

resp = requests.get(url) # 发起网络请求,返回需要时间——阻塞IO

html = resp.text

print("No%d:%s成功返回:长度为%d" % (order, url, len(html)))

pass

# 将【标准库-阻塞IO实现】替换为【gevent-非阻塞IO实现】

monkey.patch_all()

if __name__ == '__main__':

start = time.time()

time.clock()

# 协程传递参数,(方法名,参数。。。)

gevent.joinall([

gevent.spawn(getPageText, "http://www.sina.com", order=1),

gevent.spawn(getPageText, "http://www.qq.com", order=2),

gevent.spawn(getPageText, "http://www.baidu.com", order=3),

gevent.spawn(getPageText, "http://www.163.com", order=4),

gevent.spawn(getPageText, "http://www.4399.com", order=5),

gevent.spawn(getPageText, "http://www.sohu.com", order=6),

gevent.spawn(getPageText, "http://www.youku.com", order=7),

gevent.spawn(getPageText, "http://www.iqiyi.com", order=8),

])

end = time.time()

print("over,耗时%d秒" % (end - start))

print(time.clock())

pass

后记

【后记】为了让大家能够轻松学编程,我创建了一个公众号【轻松学编程】,里面有让你快速学会编程的文章,当然也有一些干货提高你的编程水平,也有一些编程项目适合做一些课程设计等课题。

也可加我微信【1257309054】,拉你进群,大家一起交流学习。

如果文章对您有帮助,请我喝杯咖啡吧!

公众号

关注我,我们一起成长~~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值