-
Python内建的
filter()
函数用于过滤序列。和
map()
类似,filter()
也接收一个函数和一个序列。和map()
不同的是,filter()
把传入的函数依次作用于每个元素,然后根据返回值是True
还是False
决定保留还是丢弃该元素。例如,在一个
list
中,删掉偶数,只保留奇数,可以这么写:def is_odd(n): return n % 2 == 1 list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15])) # 结果: [1, 5, 9, 15]
把一个序列中的空字符串删掉,可以这么写:
def not_empty(s): return s and s.strip() list(filter(not_empty, ['A', '', 'B', None, 'C', ' '])) # 结果: ['A', 'B', 'C']
可见用
filter()
这个高阶函数,关键在于正确实现一个“筛选”函数。 -
☆注意到
filter()
函数返回的是一个Iterator
,也就是一个惰性序列,所以要强迫filter()
完成计算结果,需要用list()
函数获得所有结果并返回list
。 -
用
filter
求素数计算素数的一个方法是埃氏筛法,它的算法理解起来非常简单:
首先,列出从
2
开始的所有自然数,构造一个序列:
取序列的第一个数2
,它一定是素数,然后用2
把序列的2
的倍数筛掉:
取新序列的第一个数3
,它一定是素数,然后用3把序列的3的倍数筛掉:
取新序列的第一个数5
,然后用5
把序列的5
的倍数筛掉:
不断筛下去,就可以得到所有的素数。 -
用Python来实现这个算法,可以先构造一个从
3
开始的奇数序列:def _odd_iter(): n = 1 while True: n = n + 2 yield n
注意这是一个生成器,并且是一个无限序列。
然后定义一个筛选函数:
def _not_divisible(n): return lambda x: x % n > 0
最后,定义一个生成器,不断返回下一个素数:
def primes(): yield 2 it = _odd_iter() # 初始序列 while True: n = next(it) # 返回序列的第一个数 yield n it = filter(_not_divisible(n), it) # 构造新序列
这个生成器先返回第一个素数
2
,然后,利用filter()
不断产生筛选后的新的序列。由于
primes()
也是一个无限序列,所以调用时需要设置一个退出循环的条件:# 打印1000以内的素数: for n in primes(): if n < 1000: print(n) else: break
注意到
Iterator
是惰性计算的序列,所以我们可以用Python表示“全体自然数”,“全体素数”这样的序列,而代码非常简洁。 -
小结
filter()
的作用是从一个序列中筛出符合条件的元素。由于filter()
使用了惰性计算,所以只有在取filter()
结果的时候,才会真正筛选并每次返回下一个筛出的元素。
上一篇:18.Python函数式编程 高阶函数 map/reduce 详解
下一篇:20.Python函数式编程 高阶函数 sorted 详解