了解如何在闭包里使用外围作用域中的变量

作用域bug

假如有一份列表,其中的元素都是数字,现在要对其排列,但排列时,要把出现在某个群组内的数字,放在群组外的那些数字之前。这种用法在绘制用户界面时候可能会遇到,我们可以用这个办法把重要的消息或意外的事件优先显示在其他内容前面。
实现该功能的一种常见做法,是在调用列表的sort方法时,把辅助函数传给key参数。这个辅助函数的返回值,将会用来确定列表中各元素的顺序。辅助函数可以判断受测元素是否处在重要的群组中,并据此返回相应的排序关键字(sort key)。

def sort_priority(values,group):
	def helper(x):
		if x in group:
			return (0,x)
		return (1,x)
	values.sort(key=helper)

numbers = [8,3,1,2,5,4,7,6]
group = {2,3,5,7}
sort_priority(numbers,group)
print(numbers)

输出:
在这里插入图片描述
这个函数之所以可以运行,有三大原因:
1、Python支持闭包:闭包是一种定义在某个作用域中的函数,这种函数引用了那个作用域里面的变量。helper函数之所以能够访问sort_priority的group参数,原因在于它是闭包。
2、Python的函数是一级对象,也就是说,我们可以直接引用函数、把函数赋给变量、把函数当成参数传给其他函数,并通过表达式及if语句对其进行比较和判断,等等。于是,我们可以把helper这个闭包函数,传给sort方法的key参数。
3、Python使用特殊的规则来比较两个元组。它首先比较各元组中下标为0的对应元素,如果相等,再比较下标为1的对应元素,如果还是相等,那就继续比较下标为2的对应元素,依次类推。
这个sort_priority函数如果能够改进一下,就更好了,它应该返回一个值,用来表示用户界面是否出现了优先级较高的文件,使得该函数的调用者,可以根据这个返回值做出相应的处理。添加这样的功能,看似简单。既然该函数里的闭包函数,能够判断受测数字是否处在群组内,那么不妨在发现优先级较高的文件时,从闭包函数中翻转某个标志变量,然后令sort_priority函数把经过闭包修改的那个标志变量,返回给调用者。
先试试以下这种简单的写法:

def sort_priority2(numbers,group):
	found = False
	def helper(x):
		if x in group:
			found = True
			return (0,x)
		return (1,x)
	numbers.sort(key=helper)
	return found

numbers = [8,3,1,2,5,4,7,6]
group = {2,3,5,7}
found = sort_priority2(numbers,group)
print('Found:',found)
print(numbers)

输出:
在这里插入图片描述
排列结果正确,但是found值不对。numbers里面的某些数字确实包含在group中,可是函数却返回了False,这是为什么呢?

在表达式中引用变量式,python解释器将按如下顺序遍历各作用域,以解析该引用:
1、当前函数的作用域
2、任何外围作用域(例如,包含当前函数的其他函数)
3、包含当前代码的那个模块的作用域(也叫全局作用域,global scope)
4、内置作用域(也就是包含len及str等函数的那个作用域)

如果上面这些地方都没有定义过名称相符的变量,那就抛出NameError异常。
给变量赋值时,规则有所不同。如果当前作用域内已经定义了这个变量,那么该变量就会具备新值。若是当前作用域内没有这个变量,Python则会把这次赋值视为对该变量的定义。而新定义的这个变量,其作用域就是包含赋值操作的这个函数。
上面所说的这种赋值行为,可以解释sort_priority2函数的返回值错误的原因。将found变量赋值为True,是在helper闭包里进行的。于是,闭包中的这次赋值操作,就相当于在helper内定义了名为found的新变量,而不是给sort_priority2函数中的那个found赋值。

这种问题有时称为作用域bug(scoping bug),令人困惑。不过Python语言是故意这么设计的。这种设计可以防止函数中的局部变量污染函数外面的那个模块。假如不这么做,那么函数里的每个赋值操作,都会影响外围模块的全局作用域。那样不仅显得混乱,而且由于全局变量还会与其他代码产生交互作用,所以可能引发难以探查得bug。

获取闭包内得数据得方法:

Python3中有一种特殊的写法,能够获取闭包内的数据。我们可以用nonlocal语句来表明这样的意图,也就是:给相关变量赋值的时候,应该在上层作用域中查找该变量。nonlocal的唯一限制在于,它不能延伸到模块级别,这是为了防止它污染全局作用域。
下面用nonlocal来实现这个函数:

def sort_priority3(numbers,group):
	found = False
	def helper(x):
		nonlocal found
		if x in group:
			found = True
			return (0,x)
		return (1,x)
	numbers.sort(key=helper)
	return foun

输出:
在这里插入图片描述
nonlocal语句清楚的表明:如果在闭包内给该变量赋值,那么修改的其实是闭包外的那个作用域中的变量。这与global语句互为补充,global用来表示对该变量的赋值操作,将会直接修改模块作用域里的那个变量。

然而,nonlocal也会像全局变量那样,遭到滥用,所以,建议只在极其简单的函数里使用这种机制。nonlocal的副作用很难追踪,尤其是在比较长的函数中,修饰某变量的nonlocal语句可能和修改该变量的赋值操作离得比较远,从而导致代码更加难以理解。

如果使用nonlocal的那些代码,已经写的越来越复杂,那就应该将相关的状态封装成辅助类。下面定义这个类,与nonlocal所达成的功能相同。

class Sorter(object):
	def __init__(self,group):
		self.group = group
		self.found = False
	def __call__(self,x):
		if x in self.group:
			self.found = True
			return (0,x)
		return (1,x)

numbers = [8,3,1,2,5,4,7,6]
group = {2,3,5,7}
sorter = Sorter(group)
numbers.sort(key=sorter)
print(sorter.found)
print(numbers)

Python2中不支持nonlocal关键字。为了实现类似功能,可以把found定义为一个列表。然后通过在闭包里的found[0] = True语句,来修改found的状态

------搬运自《Effective Python》

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值