一、Python的高级特性
Python中许多功能的实现都有许多方法。在python中并不是代码越多越好,而是越少越好。代码不是越复杂越好,而是越简单越好。基于这一思想,python中设计了许多非常有用的高级特性。
1.1 列表生成式
(1)简单列表生成式
例如要生成前10个数的平方[1x1, 2x2, 3x3, ..., 10x10]
,使用常规办法需要借助循环。
L = []
for x in range(1, 11):
L.append(x * x)
这种方式太过繁琐,而列表生成式可以使用一行语句代替上面的循环
[x * x for x in range(1,11)]
# [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
写列表生成式时,把要生成的元素x*x
放到前面,后面跟for循环,就可以把list创建出来。
(2)两层循环与多变量循环
列表生成式支持多重循环,例如
[m + n for m in 'ABC' for n in 'XYZ']
# ['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']
三层以上的循环就很少用到了。
由于for循环支持两个甚至多个变量,因此列表生成式也支持同样的功能
d = {'x': 'A', 'y': 'B', 'z': 'C' }
[k + '=' + v for k, v in d.items()]
# ['y=B', 'x=A', 'z=C']
(3)列表生成式的if用法
for循环加if用法
[x for x in range(1, 11) if x % 2 == 0]
# [2, 4, 6, 8, 10]
跟在for后面的if是一个筛选条件。
(4)列表生成式的if…else用法
for循环加if…else用法
[x if x % 2 == 0 else -x for x in range(1, 11)]
# [-1, 2, -3, 4, -5, 6, -7, 8, -9, 10]
for前面的部分是一个表达式,它必须根据for循环得到的x计算出一个结果,作为列表的一个元素。
上述for前面的表达式x if x % 2 == 0 else -x
才能根据x计算出确定的结果。如果只用if不加else,则考察表达式:x if x % 2 == 0
,它无法根据x计算出结果,因此程序会报错。
综上,在一个列表生成式中,for
前面的if ... else
是表达式,而for
后面的if
是过滤条件,不能带else
。
1.2 生成器
由于内存的限制,列表的容量是有限的,如果我们需要创建一个包含100万个元素的列表,但每次仅需要访问前几个元素,这样不仅占用了很大的存储空间,其它绝大多数元素占用的空间都白白浪费了。
如果元素列表可以按照某种算法推算出来,就可以在循环过程中不断推算列表元素,这样就不必一次创建完成的list,从而节省大量的空间,这种一边循环一边计算的机制,称为生成器generator。
(1)创建生成器
创建generator最简单的方法,把一个列表生成式的[]
改成()
,就创建了一个generator:
g = (x * x for x in range(10))
# <generator object <genexpr> at 0x1022ef630>
调用生成器generator的元素,可以通过for循环:
g = (x * x for x in range(10))
for n in g:
print(n)
(2)使用yield创建生成器
如果一个函数定义中包含yield
关键字,那么这个函数就不再是一个普通函数,而是一个generator函数。
def odd():
print('step 1')
yield 1
print('step 2')
yield(3)
print('step 3')
yield(5)
可以通过next()
函数获得generator的下一个返回值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration
的错误。
generator函数和普通函数的执行流程不一样。普通函数是顺序执行,遇到return
语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()
的时候执行,遇到yield
语句返回,再次执行时从上次返回的yield
语句处继续执行。
调用该generator函数时,首先要生成一个generator对象,然后用next()
函数不断获得下一个返回值:
>>> o = odd()
>>> next(o)
step 1
1
>>> next(o)
step 2
3
>>> next(o)
step 3
5
>>> next(o)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
把函数改成generator函数后,我们基本上从来不会用next()
来获取下一个返回值,而是直接使用for
循环来迭代。
for n in odd():
print(n)
二、函数式编程
2.1 高阶函数
(1)变量指向函数
函数本身也可以赋值给变量,即:变量可以指向函数。
>>> f = abs
>>> f(-10)
10
说明变量f
现在已经指向了abs
函数本身。直接调用abs()
函数和调用变量f()
完全相同。
(2)函数名也是变量
函数名其实就是指向函数的变量!对于abs()
这个函数,完全可以把函数名abs
看成变量,它指向一个可以计算绝对值的函数!
>>> abs = 10
>>> abs(-10)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'int' object is not callable
把abs
指向10
后,就无法通过abs(-10)
调用该函数了!因为abs
这个变量已经不指向求绝对值函数而是指向一个整数10
!(当然实际代码不可能这么写)
(3)传入函数
一个函数就可以接收另一个函数作为参数,这种函数就称之为高阶函数。
def add(x, y, f):
return f(x) + f(y)
当我们调用add(-5, 6, abs)
时,参数x
,y
和f
分别接收-5
,6
和abs
,实现绝对值加法计算。
(4)map/reduce
map()
函数接收两个参数,一个是函数,一个是Iterable
,map
将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator
返回。
举例说明,比如我们有一个函数f(x)=x2,要把这个函数作用在一个list [1, 2, 3, 4, 5, 6, 7, 8, 9]
上,就可以用map()
实现如下:
>>> def f(x):
... return x * x
...
>>> r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> list(r)
[1, 4, 9, 16, 25, 36, 49, 64, 81]
reduce()
函数接收两个参数,一个是函数,一个是Iterable
。
reduce
把一个函数作用在一个序列[x1, x2, x3, ...]
上,这个函数必须接收两个参数,reduce
把结果继续和序列的下一个元素做累积计算,其效果就是:
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
例如把序列[1, 3, 5, 7, 9]
变换成整数13579
:
>>> from functools import reduce
>>> def fn(x, y):
... return x * 10 + y
...
>>> reduce(fn, [1, 3, 5, 7, 9])
13579
(5)filter
Python内建的filter()
函数用于过滤序列。
filter()
接收一个函数和一个序列,把传入的函数依次作用于每个元素,然后根据返回值是True
还是False
决定保留还是丢弃该元素。
例如,在一个list中,删掉偶数,只保留奇数
def is_odd(n):
return n % 2 == 1
list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))
# 结果: [1, 5, 9, 15]
(6)sorted
排序也是在程序中经常用到的算法。无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。
Python内置的sorted()
函数就可以对list进行排序:
>>> sorted([36, 5, -12, 9, -21])
[-21, -12, 5, 9, 36]
sorted()
函数也是一个高阶函数,它还可以接收一个key
函数来实现自定义的排序
>>> sorted([36, 5, -12, 9, -21], key=abs)
[5, 9, -12, -21, 36]
默认情况下,对字符串排序,是按照ASCII的大小比较的
>>> sorted(['bob', 'about', 'Zoo', 'Credit'])
['Credit', 'Zoo', 'about', 'bob']
若要忽略大小写,按照字母序排序,只要我们能用一个key函数把字符串映射为忽略大小写排序即可
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)
['about', 'bob', 'Credit', 'Zoo']
要进行反向排序,不必改动key函数,可以传入第三个参数reverse=True
:
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)
['Zoo', 'Credit', 'bob', 'about']
2.2 返回函数
(1)函数作为返回值
高阶函数除了可以接受函数作为参数外,还可以把函数作为结果值返回。
例如如果不需要立刻求和,而是在后面的代码中,根据需要再计算怎么办?可以不返回求和的结果,而是返回求和的函数:
def lazy_sum(*args):
def sum():
ax = 0
for n in args:
ax = ax + n
return ax
return sum
当我们调用lazy_sum()
时,返回的并不是求和结果,而是求和函数:
>>> f = lazy_sum(1, 3, 5, 7, 9)
>>> f
<function lazy_sum.<locals>.sum at 0x101c6ed90>
调用函数f
时,才真正计算求和的结果:
>>> f()
25
(2)闭包
上面例子中内部函数sum
可以引用外部函数lazy_sum
的参数和局部变量。
闭包就是能够读取其他函数内部变量的函数。
需要注意的问题是,返回的函数并没有立刻执行,而是直到调用了f()
才执行。
返回闭包时牢记一点:返回函数不要引用任何循环变量,或者后续会发生变化的变量。
def count():
fs = []
for i in range(1, 4):
def f():
return i*i
fs.append(f)
return fs
f1, f2, f3 = count()
>>> f1()
9
>>> f2()
9
>>> f3()
9
使用闭包,就是内层函数引用了外层函数的局部变量。如果只是读外层变量的值,我们会发现返回的闭包函数调用一切正常。但是,如果对外层变量赋值,由于Python解释器会把x
当作函数fn()
的局部变量,它会报错。
def inc():
x = 0
def fn():
nonlocal x
x = x + 1
return x
return fn
f = inc()
print(f()) # 1
print(f()) # 2
原因是x
作为局部变量并没有初始化,直接计算x+1
是不行的。但我们其实是想引用inc()
函数内部的x
,所以需要在fn()
函数内部加一个nonlocal x
的声明。加上这个声明后,解释器把fn()
的x
看作外层函数的局部变量,它已经被初始化了,可以正确计算x+1
。
2.3 匿名函数
关键字lambda
表示匿名函数,冒号前面的x
表示函数参数。
匿名函数有个限制,就是只能有一个表达式,不用写return
,返回值就是该表达式的结果。
>>> list(map(lambda x: x * x, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
[1, 4, 9, 16, 25, 36, 49, 64, 81]
匿名函数也是一个函数对象,也可以把匿名函数赋值给一个变量,再利用变量来调用该函数:
>>> f = lambda x: x * x
>>> f(5)
25
也可以把匿名函数作为返回值返回
def build(x, y):
return lambda: x * x + y * y
2.4 装饰器
假设我们要增强某个函数的功能,比如,在函数调用前后自动打印日志,但又不希望修改函数的定义,这种在代码运行期间动态增加功能的方式,称之为“装饰器”(Decorator)。
本质上,decorator就是一个返回函数的高阶函数。
def log(func):
def wrapper(*args, **kw):
print('call %s():' % func.__name__)
return func(*args, **kw)
return wrapper
观察上面的log
,因为它是一个decorator,所以接受一个函数作为参数,并返回一个函数。(其中__name__
属性,可以拿到函数的名字)
使用log函数时要借助Python的@语法,把decorator置于函数的定义处
@log
def now():
print('2022-6-28')
把@log
放到now()
函数的定义处,相当于执行了语句:
now = log(now)
调用now()
函数,不仅会运行now()
函数本身,还会在运行now()
函数前打印一行日志:
>>> now()
call now():
2022-6-28
由于函数有__name__
等属性,但经过decorator装饰之后的函数,它们的__name__
已经从原来的'now'
变成了'wrapper'
,所以,需要把原始函数的__name__
等属性复制到wrapper()
函数中,否则,有些依赖函数签名的代码执行就会出错。
一个完整的decorator的写法如下
import functools
def log(func):
@functools.wraps(func)
def wrapper(*args, **kw):
print('call %s():' % func.__name__)
return func(*args, **kw)
return wrapper
带参数的decorator
import functools
def log(text):
def decorator(func):
@functools.wraps(func)
def wrapper(*args, **kw):
print('%s %s():' % (text, func.__name__))
return func(*args, **kw)
return wrapper
return decorator
2.5 偏函数
Python的functools
模块提供了偏函数(Partial function)功能。把一个函数的某些参数给固定住(也就是设置默认值),返回一个新的函数,调用这个新函数会更简单。
例如int()
函数提供了额外的base
参数,默认值为10
。如果传入base
参数,就可以做N进制的转换:
>>> int('12345', base=8)
5349
>>> int('12345', 16)
74565
functools.partial
就是帮助我们创建一个偏函数的,不需要我们自己定义int2()
,可以直接使用下面的代码创建一个新的函数int2
:
>>> import functools
>>> int2 = functools.partial(int, base=2)
>>> int2('1000000')
64
>>> int2('1010101')
85
本博客文章首先发布于个人博客网站:https://www.mahaofei.com/,欢迎大家访问。