选自Medium
作者: Animesh Gaitonde 机器之心编译 参与: Panda前几个月发布的 Python 3.8 包含了一项重要的新功能,即海象算子。 如果合理运用,该算子能有效地提升 Python 程序的执行效率。 本文将对海象算子的作用和效果进行介绍,并会通过示例演示其使用方法和不适用的场景。 本文作者为软件工程师 Animesh Gaitonde。
countries = [“India”, “USA”, “France”, “Germany”]
if len(countries) 5:
print ("Length of countries is " + len(countries))
在上面的代码段中,我们两次调用了函数 len()。
我们可以避免重复计算以提升可读性吗?
当然可以,我们可对这段代码进行如下改进:
country_size = len(countries)
if country_size 5:
print ("Length of countries is " + country_size)
还有进一步改进的空间吗?
我们可以不用单独一行来给「country_size」赋值吗?
if country_size := len(countries) 5 :
print ("Length of countries is " + country_size)
这就是 Python 3.8 引入的海象算子的用武之地。
我们可以在 if 语句之中直接执行声明和赋值操作。
我们下面进一步探索该算子的能力。
代码行数与复杂度的平衡
先看看以下示例
powers = [get_count(), get_count()**2, get_count()**3]
def get_count():
"Fetches count of records from a database"
多次调用一个高成本的函数
上面的示例是通过多次调用一个高成本的函数 get_count() 来填充一个列表。
有了海象算子的帮助,我们可以避免多次调用函数 get_count(),其具体的功能是将结果存储到一个变量中,然后我们可在后续的计算中复用同一个变量。
下面演示了海象算子的用法:
powers =[result:= get_count(), result**2, result**3]
def get_count():
"Fetches count of records from a database"
使用海象算子避免多次调用函数
从上面的例子可以看到,海象算子可以减少代码行数,让代码更可读,因此能简化代码审查人员的工作。
此外,这也能实现代码行数和代码复杂度的平衡。
解决理解低效的问题
employees = []
for id in employee_ids:
employee = fetch_employee(id)
if employee:
employees.append(employee)
基于一个条件填充列表
上面的示例需要多次执行循环。
一开始,我们创建一个空列表,然后在 id 列表上迭代并通过检查结果是否有效来填充我们创建的列表。
我们可以简化上面的代码,将其浓缩为一行:
employees = [result for id in employee_ids if (result:= fetch_employee(id))]
使用海象算子避免低效理解
文件分块处理
在处理大文件时,我们会将文件分块读取。
每当读取一个分块时,都会检查它的值,并且该值也是 while 循环的终止条件。
chunk = file.read(256)
while chunk:
process(chunk)
chunk = file.read(256)
我们可以在 while 循环表达式中读取数据以及为要读取的数据赋值。
由此我们就能避免在 while 循环之外显式地声明变量。
如下示例:
while chunk := file.read(256) :
process(chunk)
正则表达式匹配
正则表达式匹配是一个两步式过程。
第一步是检查是否有匹配,第二步是提取匹配的部分。
obj = re.match(info).group(1) if re.match(info) else None
正则表达式匹配
从上面的代码可以观察到,我们在一次匹配中重复计算了 re.match(info)。
这会减慢该程序的执行速度,而且数据量越大减慢得越明显。
上面的代码可以重写为如下形式,从而避免重复计算:
obj = match.group(1) if match:= re.match(info) else None
使用 := 的正则表达式匹配
不能使用海象算子的地方
为变量赋值
a = 5 # 有效
a := 5 # 无效