1、yield
1.1、协程实现
import time
def work1():
while True:
print("----work1---")
yield
time.sleep(0.5)
def work2():
while True:
print("----work2---")
yield
time.sleep(0.5)
def main():
w1 = work1()
w2 = work2()
while True:
next(w1)
next(w2)
if __name__ == "__main__":
main()
2、greenlet
为了更好使用协程来完成多任务,python中的greenlet
模块对其封装,从而使得切换任务变的更加简单.
from greenlet import greenlet
import time
def test1():
while True:
print("---A--")
gr2.switch()
time.sleep(0.5)
def test2():
while True:
print("---B--")
gr1.switch()
time.sleep(0.5)
gr1 = greenlet(test1)
gr2 = greenlet(test2)
#切换到gr1中运行
gr1.switch()
# 协程与进程、线程的不同
# 1. 进程、线程 创建完之后,到底是哪个进程、线程执行 不确定,这要让操作系统来进行计算(调度算法,例如优先级调度)
# 2. 协程是可以人为来控制的
3、gevent使用
import gevent
def f1(n):
for i in range(n):
print("-----f1-----", i)
def f2(n):
for i in range(n):
print("-----f2-----", i)
def f3(n):
for i in range(n):
print("-----f3-----", i)
g1 = gevent.spawn(f1, 5)
g2 = gevent.spawn(f2, 5)
g3 = gevent.spawn(f3, 5)
g1.join() # join会等待g1标识的那个任务执行完毕之后 对其进行清理工作,其实这就是一个 耗时操作
g2.join()
g3.join()
3.1、gevent切换执行
import gevent
def f1(n):
for i in range(n):
print("-----f1-----", i)
gevent.sleep(1)
def f2(n):
for i in range(n):
print("-----f2-----", i)
gevent.sleep(1)
def f3(n):
for i in range(n):
print("-----f3-----", i)
gevent.sleep(1)
g1 = gevent.spawn(f1, 5)
g2 = gevent.spawn(f2, 5)
g3 = gevent.spawn(f3, 5)
g1.join() # join会等待g1标识的那个任务执行完毕之后 对其进行清理工作,其实这就是一个 耗时操作
g2.join()
g3.join()
# 使用gevent来实现多任务的时候,有一个很特殊的地方
# 它可以自行切换协程指定的任务,而且切换的前提是:当一个任务用到耗时操作(例如延时),它就会把这个时间拿出来去做另外的任务
# 这样做最终实现了多任务 而且自动切换
3.2、给程序补补丁
import gevent
import time
from gevent import monkey
monkey.patch_all() # 这句话一定要放到 使用time等耗时操作的前面,它最后的的效果是 将time模块中的延时全部替换为 gevent中的演示
# time模块中的延时是不具备 自动切换任务的功能,而gevent中的延时 具备,因此我们需要将time全部改为gevent,
# 为了更快速的让本.py中的所有time变为gevent所以我们需要执行 monkey.patch_all()
def f1(n):
for i in range(n):
print("-----f1-----", i)
# gevent.sleep(1)
time.sleep(1)
def f2(n):
for i in range(n):
print("-----f2-----", i)
# gevent.sleep(1)
time.sleep(1)
def f3(n):
for i in range(n):
print("-----f3-----", i)
# gevent.sleep(1)
time.sleep(1)
g1 = gevent.spawn(f1, 5)
g2 = gevent.spawn(f2, 5)
g3 = gevent.spawn(f3, 5)
g1.join() # join会等待g1标识的那个任务执行完毕之后 对其进行清理工作,其实这就是一个 耗时操作
g2.join()
g3.join()
# 使用gevent来实现多任务的时候,有一个很特殊的地方
# 它可以自行切换协程指定的任务,而且切换的前提是:当一个任务用到耗时操作(例如延时),它就会把这个时间拿出来去做另外的任务
# 这样做最终实现了多任务 而且自动切换
3.3、使用joinall
import gevent
import random
import time
from gevent import monkey
monkey.patch_all()
def coroutine_work(coroutine_name):
for i in range(10):
print(coroutine_name, i)
time.sleep(random.random())
def coroutine_work2(coroutine_name):
for i in range(10):
print(coroutine_name, i)
time.sleep(random.random())
gevent.joinall([
gevent.spawn(coroutine_work, "work1"),
gevent.spawn(coroutine_work2, "work2")
])
4、并发下载器
from gevent import monkey
import gevent
import urllib.request
import ssl
monkey.patch_all()
ssl._create_default_https_context = ssl._create_unverified_context
def my_downLoad(file_name, url):
print('GET: %s' % url)
resp = urllib.request.urlopen(url)
data = resp.read()
with open(file_name, "wb") as f:
f.write(data)
print('%d bytes received from %s.' % (len(data), url))
gevent.joinall([
gevent.spawn(my_downLoad, "1.mp4", '视频URL地址'),
gevent.spawn(my_downLoad, "2.mp4", '视频URL地址2')
])
小结:
- 进程是资源分配的单位
- 线程是操作系统调度的单位
- 进程切换需要的资源很最大,效率很低
- 线程切换需要的资源一般,效率一般(当然了在不考虑GIL的情况下)
- 协程切换任务资源很小,效率高
- 多进程、多线程根据cpu核数不一样可能是并行的,但是协程是在一个线程中 所以是并发。