1.协程
协程,又称微线程,纤程。英文名Coroutine。一句话说明什么是线程:协程是一种用户态的轻量级线程。
协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈。因此:
协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状态,换种说法:进入上一次离开时所处逻辑流的位置。
2.协程的优点缺点。
协程的好处: 无需线程上下文切换的开销 无需原子操作锁定及同步的开销 "原子操作(atomic operation)是不需要synchronized",所谓原子操作是指不会被线程调度机制打断的操作;这种操作一旦开始,就一直运行到结束,中间不会有任何 context switch (切换到另一个线程)。
原子操作可以是一个步骤,也可以是多个操作步骤,但是其顺序是不可以被打乱,或者切割掉只执行部分。视作整体是原子性的核心。 方便切换控制流,简化编程模型 高并发+高扩展性+低成本:一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理。 缺点: 无法利用多核资源:协程的本质是个单线程,它不能同时将 单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU上.当然我们日常所编写的绝大部分应用都没有这个必要,除非是cpu密集型应用。 进行阻塞(Blocking)操作(如IO时)会阻塞掉整个程序
3.python的greenlet模块。
greenlet是一个用C实现的协程模块,相比与python自带的yield,它可以使你在任意函数之间随意切换,而不需把这个函数先声明为generato
手动切换。
3.1 greenlet的简单实例。
def t1(): print(11) gr2.switch() print(33) gr2.switch() def t2(): print(22) gr1.switch() print(44) gr1 = greenlet(t1) gr2 = greenlet(t2) gr1.switch()
4.python的Gevent模块。
Gevent 是一个第三方库,可以轻松通过gevent实现并发同步或异步编程,在gevent中用到的主要模式是Greenlet, 它是以C扩展模块形式接入Python的轻量级协程。
Greenlet全部运行在主程序操作系统进程的内部,但它们被协作式地调度。
4.1 gevent的简单实例
import gevent,time def t1(): print(11) gevent.sleep(1) print(33) def t2(): print(22) gevent.sleep(3) print(44) start_time = time.time() gevent.joinall([ gevent.spawn(t1), gevent.spawn(t2), ]) print('cost:{0}'.format(time.time() - start_time))
5.协程实现一个简单爬虫 并对比,串行和并行的执行时间。
import gevent,time,requests from gevent import monkey """ 把当前程序的所有IO操作,标记上记号。 让gevent知道程序中IO操作的结束时间。 """ monkey.patch_all() def get1(url): print('get url : {0}'.format(url)) rep = requests.get(url) rep.encoding = 'utf-8' print(rep) start_time = time.time() url_lists = [ 'http://www.gec-edu.org/', 'http://www.baidu.com/', 'http://www.sina.com.cn/', ] for item in url_lists: get1(item) # gevent.joinall() print('cost:{0}'.format(time.time() - start_time)) aync_start_time = time.time() gevent.joinall([ gevent.spawn(get1(url_lists[0])), gevent.spawn(get1(url_lists[1])), gevent.spawn(get1(url_lists[2])), ]) print('aync cost:{0}'.format(time.time() - aync_start_time))
6.利用协程实现socket多并发。
6.1 client.py
import gevent,socket,time def run(): client() def client(): client = socket.socket() client.connect(('127.0.0.1', 8089)) while True: input_value = input(">>:").strip() if not input_value: continue client.send(input_value.encode('utf-8')) rev_data = client.recv(1024).decode('utf-8') print(rev_data) continue if __name__ == '__main__': run()
6.2 servier.py
import gevent,socket,time from gevent import monkey """ 利用gevent实现socket服务端的多并发。 思路:每一请求切换一个协程处理 """ monkey.patch_all() def server(): server = socket.socket() # 绑定监听端口 server.bind(('127.0.0.1', 8089)) # 监听 server.listen() while True: connect,address = server.accept() print('server listen request...',address) """ 如果进来一个请求,则交由一个协程处理 """ gevent.spawn(handle_request,connect,address) def handle_request(conncet,address): try: while True: rev_data = conncet.recv(1024).decode('utf-8') if not rev_data: break print(address,'server recv : {0}'.format(rev_data)) conncet.send('recv ok! request data : {0}'.format(rev_data).encode('utf-8')) except Exception as e: print(e) finally: conncet.close() def run(): server() if __name__ == '__main__': run()