Week 5
本周学习主要内容包括函数作用域,闭包,匿名函数,递归函数,生成器函数等
函数返回值(return)
- 用return语句返回“返回值”
- 所有函数都有返回值,没有return语句则为隐式调用return None
- return语句并不一定是函数的语句块的最后一条语句
- 一个函数可以有多个return语句,但只有一条可以被执行;如果没有一条被执行,隐式调用return None
- 如果有必要可以显式调用return None,简写为return
- 如果函数执行了return语句,函数就会返回,当前执行的return语句后的其他语句则不会执行
- 返回值的作用:结束函数调用,返回“返回值”
函数不能同时返回多个值
多个数值会被python隐式封装成元组,仍然只返回一个值
可以使用解构提取返回值 x,y,z = showlist()
函数作用域
- 作用域:一个标识符的可见范围,这就是标识符的作用域。一般常说的是变量的作用域。
- 函数作用域:函数是一个封装,他会开辟一个作用域,x变量被限制在这个作用域中,所以函数外部x变量不可见!
- 每个函数都会开辟一个作用域
作用域分类
- 全局作用域:(global)
- 在整个程序运行环境中都可见
- 全局作用域中的变量称为全局变量
- 局部作用域:(local)
- 在函数、类等内部可见,也叫本地作用域(local)
- 局部作用域中的变量为局部变量,使用范围不能超过其所在局部作用域
一般来讲,外部作用域变量在函数内部可见;
反之,函数内部的局部变量,函数外部不可见。
函数嵌套:
在一个函数中定义另一个函数时,内部函数不能在外部直接使用,会有NameError异常,因为他在函数外部不可见。内部函数在此处相当于一个标识符,是外部函数内部定义的变量而已。
嵌套结构的作用域:
- 外层变量在内部作用域可见
- 内层作用域中如果定义了一个变量值(o = 97),相当于在当前内层函数中重新定义了一个新变量,但这个新变量不能覆盖外部作用域中的变量o;但对内层函数来说只能可见自己作用域中定义的变量o了。
赋值语句的问题:
x = 300
def foo():
x+=1 #赋值语句
print(x)
x
>>> 300
foo() # 未赋值就调用
---------------------------------------------------------------------------
UnboundLocalError Traceback (most recent call last)
<ipython-input-51-c19b6d9633cf> in <module>
----> 1 foo()
<ipython-input-49-78729a9a61fb> in foo()
1 x = 300
2 def foo():
----> 3 x+=1
4 print(x)
UnboundLocalError: local variable 'x' referenced before assignment
原因:
- x += 1 ==> x = x+1
- 只要在函数中出现x=… 这样的变量赋值语句,且此变量不加任何语句修饰,那么此变量一定是当前函数的局部变量,在此函数中所有x都是用该x。
- 赋值即定义!!
- 因此此处x += 1相当于使用了局部变量x,但这个x还没有完成赋值就被进行+1操作了,因此会产生UnboundLocalError。
global语句
x = 600 #全局变量
def foo():
global x #这个标识符被修饰了,他还是本地变量吗?--不是,被global声明成了全局变量
x += 1 #x = x+1 为x赋值,x = x就是本地变量,但如果对x使用了global
print(x)
- 使用global关键字的变量,将foo内的x声明为使用外部的全局作用域中定义的x
- 全局作用域中必须有x的定义
- 即使在foo中又写了x = 10,也不会在foo这个局部作用域中定义局部变量x
- 使用了global,foo中x就不是局部变量了,而是全局变量
- 尽量不使用global,如果函数需要使用外部全局变量,尽量使用函数的形参定义,通过调用传实参解决
闭包
- 自由变量:未在本地作用域中定义的变量(比如定义在内层函数外的外层函数作用域中的变量)
- 闭包:在嵌套函数中,指***内层函数引用到了外层函数的自由变量***,即形成闭包现象
def counter():
c = [0]
def inc():
c[0] += 1 #报错吗?为什么?
return c[0]
return inc
#报错吗?
#有闭包吗?
foo = counter() #foo就是inc,inc引用地址交给了foo,
#但counter已经调用结束,按理说内部局部变量要消亡
foo()
- counter内部产生两个局部变量c和inc
- foo获得了counter()执行的结果,inc指向的引用地址
- counter() 函数执行完,局部变量inc和c标识符都消亡了,(但c和inc指向的对象并没有消亡!)
- foo():由于外层函数已经执行结束,但内层函数对象并没有消亡,不知道什么时候调用;但内层函数用到了外层函数的自由变量c
- foo指向的函数对象要使用counter中的c,c指向的列表[0]不消亡,由这个不消亡的内存函数对象来保存这个列表,这就是闭包。
non-local语句:
nonlocal:将变量标记为不在本地作用域定义,而是在上级的某一级局部作用域中定义,但不能是全局作用域中定义。
def counter(): #python 3中比较简单实现闭包的方式
c = 0
def inc():
nonlocal c #non-local 不是我本地的,但是外部的,是我当前函数外层函数中的某一层上的c变量
#但绝不能是全局的
c+=1
return c
return inc
def func():
nonlocal d #此处向外找d,d就是全局了
d = 100
--------------------------------------------------------------------
File "<ipython-input-127-d3851b2f7792>", line 2
nonlocal d
^
SyntaxError: no binding for nonlocal 'd' found
默认值作用域
a = list(range(2))
print(id(a),a)
a += [10]
print(id(a),a) #地址没变
a = a +[20]
print(id(a),a) #地址变了
--------------------------------------------
1621904477576 [0, 1]
1621904477576 [0, 1, 10]
1621904446600 [0, 1, 10, 20]
a = tuple(range(2))
print(id(a),a)
a += (10,) #对于不可变类型元组来说,将 += --> = +
print(id(a),a) #地址变了
a = a + (20,)
print(id(a),a) #地址变了
--------------------------------------------
1621903123528 (0, 1)
1621904541000 (0, 1, 10)
1621904615368 (0, 1, 10, 20)
变量名解析原则LEGB
- Local
- Enclosing,嵌套函数的外部函数的命名空间
- Global,全局作用域,即一个模块的命名空间,模块被import时创建,解释器退出时消亡
- Build-in,内置模块的命名空间,生命周期从python解释器启动时创建到解释器退出时消亡
函数的销毁
- 定义一个函数就是生成一个函数对象,函数名指向的就是函数对象
- 可以用del语句删除,使其引用计数-1
- 可以使用同名标识符覆盖原有定义,本质上也是使其引用计数-1
- python程序结束时,所有对象销毁
- 函数也是对象,是否销毁还是看引用计数是否减为0
匿名函数
- 定义: 隐藏名字没有名称的函数
Lambda表达式
- 使用lambda关键字定义匿名函数,格式为lambda[参数列表]: 表达式
- 参数列表不需要小括号,无参就不写参数
- 冒号用来分割参数列表和表达式部分
- 不需要使用return,表达式的值,就是匿名函数的返回值,表达式中不能出现等号
- lambda表达式(匿名函数)只能写在一行上,也叫单行函数
递归函数
函数执行流程
- 函数活动和栈有关
- 栈是后进先出的数据结构
- 栈是从底向顶端生长,栈中插入数据称为压栈、入栈,从栈顶弹出数据称为出栈
- 每个栈帧对应一个未运行完的函数,栈帧中保存了该函数的返回地址和局部变量
- 函数每次调用都会创建一个独立的栈帧(Stack Frame)入栈
- 哪怕是同一个函数两次调用,但每次调用都是独立的,这两次调用没什么关系 (不准确)
递归(Recursion)
- 函数直接或间接调用自身就是递归
- 递归需要有边界条件,递归前进段,递归返回段
- 递归一定要有边界条件
- 边界条件不满足时递归前进
- 边界条件满足时递归返回
递归一定要有退出条件,递归调用一定要执行到这个退出条件,没有退出条件的递归调用,就是无限调用
递归调用的深度不宜过深
Python对递归的深度作出限制以保护解释器:
#RecursionError递归异常,maximum recursion depth exceeded,递归层次太深
#栈超界,Python中为了防止栈溢出,提供了调用深度问题,默认1000(IPython 3000)
#import sys
sys.getrecursionlimit()
递归效率
不如循环,可以进行改进,将循环改成递归调用,用递归调用次数来模拟循环次数。但递归函数有深度限制,函数调用开销较大。
间接递归
- 函数通过别的函数调用了自己,同样是递归。
- 只要是递归调用,不论直接间接都要注意边界返回问题;但间接调用有时候不明显,代码调用复杂时很难发现出现了递归调用,会很危险。
- 靠代码规范来避免。
总结:
- 递归表达自然符合逻辑思维
- 递归相对运行效率低,每一次调用函数都要开辟栈帧
- 递归有深度限制,如果层次太深函数连续压栈会导致溢出
- 有限次数递归可以用递归调用,或者用循环代替;循环代码稍复杂,但只要不是死循环,可以多次迭代直至算出结果
- 绝大多数递归都可以用循环实现
- 即使递归代码简洁,但能不用就不用
插入排序
- 每一趟都要把待排序数放到有序区中合适的插入位置
核心算法
- 结果可为升序或降序
- 扩大有序去区,减小无序区
- 增加一个哨兵位,其中放置每一趟待比较值
- 将哨兵位数值与有序区数值从右到左依次比较,找到哨兵位数值合适的插入点
算法实现
- 增加哨兵位:
- 为了方便,采用列表头部索引0的位置放置哨兵位
- 每一次从有序区最右端后的下一个数,即无序区最左端的数放到哨兵位
- 比较与挪动:
- 从有序区最右端开始,从右到左依次与哨兵比较
- 比较数比哨兵大,则右移一下,换下一个左边的数比较
- 直到找不到大于哨兵的比较数,把哨兵插入到这个数右侧的空位即可
总结:
- 最好情况正好是升序排列,比较迭代n-1次
- 最差情况正好是降序排列,比较迭代n(n-1)/2次,数据挪动非常多
- 使用两层嵌套循环,时间复杂度O(n^2)
- 稳定排序算法
- 使用在小规模数据比较
- 如果操作耗时大,可以用二分查找来提高效率,即二分查找插入排序
生成器函数
- 包含yield语句的生成器函数调用后,生成生成器对象的时候,生成器函数的函数体不会立即执行。
- next(generator)会从函数的当前位置向后执行到之后碰到的第一个yield语句,会弹出值并暂停函数执行
- 再次调用next函数和上一条一样的处理过程
- 再继续调用next函数,生成器函数如果结束执行(显式或隐式调用了return语句)会抛出Stopiteration异常
生成器应用:
- 无限循环
- 斐波那契数列
- 生成器交互:
- 调用send方法,就可以把send的实参传给yield语句做结果,这个结果可以在等式右边 他变量
- send和next一样可以推动生成器启动并执行
- 协程Coroutine
- 生成器的高级用法
- 比线程进程轻量级,在用户空间调度函数的一种实现
- Python3 asyncio就是协程实现
- 协程调度器:两个生成器A、B,next(A)之后,A执行到yield语句暂停,然后去执行next(B)
- 协程是一种非抢占式调度
树
重要定义:
- 非线性结构,n个(n>=0)元素的集合
- n=0时为空树
- 树中只有一个特殊的没有前驱的元素称为树的根root
- 除此之外树中所有元素都有且只能有一个前驱元素,可以有0个或多个后继
递归定义:树T是n个元素的集合;n=0时为空树
有且只有一个特殊元素根,剩余元素都可以被划分为m个互不相交的集合T1、T2、T3……,而每一个集合都是树,称为T的子树subtree,子树也有自己的根
- 结点:树中的数据元素
- 结点的度degree:结点拥有的子树数目称为度,记作d(v)
- 叶子结点:结点的度为0,称为叶子结点leaf、终端结点、末端结点
- 分支结点:结点的度不为0,称为非终端结点或分支结点
- 分支:结点之间的关系
- 内部结点:除根结点外的分支结点,不包括叶子结点
- 树的度是树内各节点的度的最大值。例:D结点度最大为3,则该树的度数为3。
- 孩子结点:结点的子树的根结点称为该结点的孩子
- 双亲结点:一个结点是他各子树的根结点的双亲
- 兄弟结点:具有相同双亲结点的结点
- 子孙结点:从根结点到该结点所经分支上的所有结点
- 节点层次(level):根结点为第一层,跟的孩子为第二层,以此类推记作L(v)
- 树的深度(depth):树的层次的最大值
- 有序树:结点的子树有顺序,不能交换
- 无序树:结点的子树无序,可交换
- 路径:树中的k个结点n1、n2、n3……满足ni是n(i+1)的双亲,称为n1到nk的一条路径
- 路径长度:路径上的节点数-1,也是分支数
- 森林:m(m>2)棵不相交的树的集合
二叉树:
- 每个结点最多两棵子树
- 二叉树不存在度数大于2的结点
- 他是有序树,左子树右子树是有顺序的,不能交换次序
- 即使某个结点只有一棵子树,也要确定他是左子树还是右子树
5种形态:
空二叉树
只有一个根结点
根结点只有左子树
根结点只有右子树
根结点有左子树和右子树
斜树
左斜树:所有结点都只有左子树;
右斜树:所有结点都只有右子树。
满二叉树
- 一棵二叉树的所有分支结点都有左子树和右子树,并且所有叶子结点只存在在最下面一层
- 同样深度二叉树中,满二叉树结点最多
- k为深度(1<=k<=n),则结点总数为2^k-1
完全二叉树
- 若二叉树深度为k二叉树的层数从1到k-1层的结点都达到了最大个数,在第k层的所有结点都集中在最左边,这就是完全二叉树
- 完全二叉树由满二叉树引出
- 满二叉树
性质:
- 在二叉树的第i层,至多有2^(i-1)个结点(i>=1)
- 深度为k的二叉树,至多有2^(i-1)个结点(i>=1)
- 对任何一棵二叉树T,如果其终端结点数为n0,度数为2的结点为n2,则有n0 = n2 + 1, 即叶子结点数-1就等于度数为2的结点数
高阶函数
一等公民(First-Class Object)
- 函数在Python中是一等公民
- 函数也是对象,是可调用对象
- 函数可以作为普通变量,也可以作为函数的参数,返回值
高阶函数(High-order Function)
- 数学概念y = f(g(x)
- 至少能满足下面一个条件:
接受一个或多个函数作为参数
输出一个函数
sorted函数原理
def sort(iterable,*,key=None,reverse=False): #[1,2,3]
newlist = []
#下面是算法,从源列表iterable中遍历元素,每一个元素逐个插入到newlist中合适位置
#生成一个升序或降序的newlist
#如果可以,先实现reverse
#如果可以,在实现key
for x in iterable: # x 2
#在newlist中,从第一个元素开始,一定要保证有序,可以认为newlist就是有序区
cx = key(x)
for i,y in enumerate(newlist): #[1] 0,1
cy = key(y)
comp = cx>cy if reverse else cx<cy #if x<y 升序 #if x>y: #降序
if comp:
newlist.insert(i,x) #在当前i位置插入y => [2,1]
break
else:
newlist.append(x) #第一个元素 newlist[1]
return newlist #有序的列表