一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、学习软件
工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
三、入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
当创建一个 greenlet 时,首先初始化一个空的栈, switch 到这个栈的时候,会运行在 greenlet 构造时传入的函数(首先在test1中打印 12), 如果在这个函数(test1)中 switch 到其他协程(到了test2 打印 56),那么该协程会被挂起,等到切换回来(在test2 中切换到 test1 打印34)。当这个协程对应函数执行完毕,那么这个协程就变成dead状态。
greenlet 的 module 与 class
dir(greenlet)
[‘GREENLET_USE_CONTEXT_VARS’, ‘GREENLET_USE_GC’, ‘GREENLET_USE_TRACING’, ‘GreenletExit’, ‘_C_API’, ‘doc’, ‘file’, ‘loader’, ‘name’, ‘package’, ‘spec’, ‘version’, ‘error’, ‘getcurrent’, ‘gettrace’, ‘greenlet’, ‘settrace’]
其中,比较重要的是: getcurrent(), 类greenlet、异常类GreenletExit 。
getcurrent() : 返回当前的greenlet实例;
GreenletExit: 是一个特殊的异常,当触发了这个异常的时候,即使不处理,也不会抛到其parent(后面会提到协程中对返回值或者异常的处理)
greenlet.greenlet:
[‘GreenletExit’, ‘bool’, ‘class’, ‘delattr’, ‘dict’, ‘dir’, ‘doc’, ‘eq’, ‘format’, ‘ge’, ‘getattribute’, ‘getstate’, ‘gt’, ‘hash’, ‘init’, ‘init_subclass’, ‘le’, ‘lt’, ‘ne’, ‘new’, ‘reduce’, ‘reduce_ex’, ‘repr’, ‘setattr’, ‘sizeof’, ‘str’, ‘subclasshook’, ‘_stack_saved’, ‘dead’, ‘error’, ‘getcurrent’, ‘gettrace’, ‘gr_frame’, ‘parent’, ‘run’, ‘settrace’, ‘switch’, ‘throw’]比较重要的几个属性:
- run:当 greenlet 启动的时候会调用到这个callable,如果我们需要继承greenlet.greenlet时,需要重写该方法
- switch:前面已经介绍过了,在greenlet之间切换
- parent:可读写属性,后面介绍
- dead:如果greenlet执行结束,那么该属性为true
- throw:切换到指定greenlet后立即跑出异常
import greenlet
def test1(x, y):
z = gr2.switch(x+y)
print('test1 ', z)
def test2(u):
print('test2 ', u)
gr1.switch(10)
gr1 = greenlet.greenlet(test1)
gr2 = greenlet.greenlet(test2)
print(gr1.switch("hello", " world"))
switch not all
import greenlet
def test1(x, y):
z = gr2.switch(x+y)
print('test1 ', z)
def test2(u):
print('test2 ', u)
gr1.switch(10)
gr1 = greenlet.greenlet(test1)
gr2 = greenlet.greenlet(test2)
print(gr1.switch("hello", " world"))
# 'test2 ' 'hello world'
# 'test1 ' 10
# None
每一个 Greenlet 都有一个 parent,一个新的 greenlet 在哪里创生,当前环境的 greenlet 就是这个新 greenlet 的 parent。所有的greenlet 构成一棵树,其跟节点就是还没有手动创建 greenlet 时候的 ”main” greenlet(事实上,在首次 import greenlet 的时候实例化)。当一个协程 正常结束,执行流程回到其对应的parent;或者在一个协程中抛出未被捕获的异常,该异常也是传递到其parent。
greenlet 生命周期
from greenlet import greenlet
def test1():
gr2.switch(1)
print('test1 finished')
def test2(x):
print('test2 first', x)
z = gr1.switch()
print('test2 back', z)
gr1 = greenlet(test1)
gr2 = greenlet(test2)
gr1.switch()
print('gr1 is dead?: %s, gr2 is dead?: %s' % (gr1.dead, gr2.dead))
gr2.switch()
print('gr1 is dead?: %s, gr2 is dead?: %s' % (gr1.dead, gr2.dead))
print(gr2.switch(10))
test2 first 1
test1 finished
gr1 is dead?: True, gr2 is dead?: False
test2 back ()
gr1 is dead?: True, gr2 is dead?: True
10
从这个例子可以看出:
1.只有当协程对应的函数执行完毕,协程才会 die,所以第一次 Check 的时候 gr2 并没有 die,因为第 9 行切换出去了就没切回来。在 main 中再 switch 到 gr2 的时候, 执行后面的逻辑,gr2 die
2.如果试图再次 switch 到一个已经是 dead 状态的 greenlet 会怎么样呢,事实上会切换到其 parent greenlet。
Greenlet Traceing
Greenlet 也提供了接口使得程序员可以监控 greenlet 的整个调度流程。主要是 gettrace 和 settrace(callback) 函数。
import greenlet
def test\_greenlet\_tracing():
def callback(event, args):
print(event, 'from', id(args[0]), 'to', id(args[1]))
def dummy():
g2.switch()
def dummyexception():
raise Exception('excep in coroutine')
main = greenlet.getcurrent()
g1 = greenlet.greenlet(dummy)
g2 = greenlet.greenlet(dummyexception)
print('main id %s, gr1 id %s, gr2 id %s' % (id(main), id(g1), id(g2)))
oldtrace = greenlet.settrace(callback)
try:
g1.switch()
except BaseException as e:
print('Exception : ', e)
finally:
greenlet.settrace(oldtrace)
test_greenlet_tracing()
main id 1397838280136, gr1 id 1397838280312, gr2 id 1397838280488
switch from 1397838280136 to 1397838280312
switch from 1397838280312 to 1397838280488
throw from 1397838280488 to 1397838280136
Exception : excep in coroutine
其中 callback 函数 event 是 switch 或者 throw 之一,表明是正常调度还是异常跑出;args 是二元组,表示是从协程 args[0] 切换到了协程 args[1]。上面的输出展示了切换流程:从 main 到 gr1,然后到 gr2,最后回到 main。
greenlet使用建议
使用greenlet需要注意一下三点:
- greenlet 创建之后,一定要结束,不能 switch 出去就不回来了,否则容易造成内存泄露
- python 中每个线程都有自己的 main greenlet 及其对应的 sub-greenlet ,不同线程之间的 greenlet 是不能相互切换的
- 不能存在循环引用,这个是官方文档明确说明:”Greenlets do not participate in garbage collection; cycles involving data that is present in a greenlet’s frames will not be detected. “
from greenlet import greenlet, GreenletExit
huge = []
def show\_leak():
def test1():
gr2.switch()
def test2():
huge.extend([x \* x for x in range(100)])
gr1.switch()
print('finish switch del huge')
del huge[:]
gr1 = greenlet(test1)
gr2 = greenlet(test2)
gr1.switch()
gr1 = gr2 = None
print('length of huge is zero ? %s' % len(huge))
if __name__ == '\_\_main\_\_':
show_leak()
# output: length of huge is zero ? 100
在test2函数中,第11行,我们将huge清空,然后再第16行将gr1、gr2的引用计数降到了0。但运行结果告诉我们,第11行并没有执行,所以如果一个协程没有正常结束是很危险的,往往不符合程序员的预期。greenlet提供了解决这个问题的办法,官网文档提到:如果一个greenlet实例的引用计数变成0,那么会在上次挂起的地方抛出GreenletExit异常,这就使得我们可以通过try … finally 处理资源泄露的情况。如下面的代码:
from greenlet import greenlet, GreenletExit
huge = []
def show\_leak():
def test1():
gr2.switch()
def test2():
huge.extend([x \* x for x in range(100)])
try:
gr1.switch()
finally:
print('finish switch del huge')
del huge[:]
gr1 = greenlet(test1)
gr2 = greenlet(test2)
gr1.switch()
gr1 = gr2 = None
print('length of huge is zero ? %s' % len(huge))
if __name__ == '\_\_main\_\_':
show_leak()
# output :
# finish switch del huge
上述代码的switch流程:main greenlet --> gr1 --> gr2 --> gr1 --> main greenlet, 很明显gr2没有正常结束(在第10行挂起了)。第18行之后gr1,gr2的引用计数都变成0,那么会在第10行抛出GreenletExit异常,因此finally语句有机会执行。同时,在文章开始介绍Greenlet module的时候也提到了,GreenletExit这个异常并不会抛出到parent,所以main greenlet也不会出异常。
看上去貌似解决了问题,但这对程序员要求太高了,百密一疏。所以最好的办法还是保证协程的正常结束。
gevent
安装:pip3 install gevent
因为 python 线程的性能问题,在python中使用多线程运行代码经常不能达到预期的效果。而有些时候我们的逻辑中又需要开更高的并发,或者简单的说,就是让我们的代码跑的更快,在同样时间内执行更多的有效逻辑、减少无用的等待。gevent 就是一个现在很火、支持也很全面的 python第三方协程库。
Python 通过 yield 提供了对 协程 的基本支持,但是不完全。greenlet 已经实现了协程,但是这个需要工人切换,有点麻烦。python 还有一个比 greenlet 更强大的并且能够自动切换任务的模块 gevent,gevent 为 Python提供了比较完善的协程支持。
(1)Python所有方向的学习路线(新版)
这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
最近我才对这些路线做了一下新的更新,知识体系更全面了。
(2)Python学习视频
包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。
(3)100多个练手项目
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!