python cookbook 学习笔记第一章数据结构和算法(15)过滤序列元素

最新推荐文章于 2018-11-17 21:27:29 发布

百无一用生

最新推荐文章于 2018-11-17 21:27:29 发布

阅读量129

点赞数

分类专栏： python cookbook 学习笔记第一章

python cookbook 学习笔记第一章专栏收录该内容

18 篇文章 0 订阅

订阅专栏

过滤序列元素
-** 问题**
- 有一个数据序列，想利用以些规则从中提取出来需要的值或者是缩短序列。
解决方案：
- 最简单的过滤序列元素的方法就是使用列表推导。比如：

mylist = [1, 4, -5, 10, -7, 2, 3, -1]

[n for n in mylist if n > 0]  # [1, 4, 10, 2, 3]
[n for n in mylist if n < 0]  # [-5, -7, -1]

使用列表推导的一个潜在缺陷就是如果输入非常大的时候会产生一个非常大的结果集，占用大量内存。如果对内存比较敏感，那么可以使用生成器表达式迭代产生过滤的元素。比如：

pos = (n for n in mylist if n > 0)
print(pos)  # <generator object <genexpr> at 0x0000000002134660>

for x in pos:
    print(x)

有时候，过滤规则比较复杂，不能简单的在列表推导或者生成器表达式中表达出来。比如，假设过滤的时候需要处理一些异常或者其他复杂情况。这时候可以将过滤代码放到一个函数中，然后使用内建的filter() 函数。示例如下：

values = ["1", "2", "-3", "-", "4", "N/A", "5"]
def is_int(val):
    try:
        x = int(val)
        return True
    except ValueError:
        return False

ivals = list(filter(is_int,values))

print(ivals)  # ['1', '2', '-3', '4', '5']

filter() 函数创建了一个迭代器，因此如果像要得到一个列表的话，就得像示例那样使用list()去转换。
讨论： 列表推导和生产期表达式同他刚才情况下是过滤数据最简单的凡是。其实他们还能再过滤的时候转换数据。比如：

mylist = [1, 4, -5, 10, -7, 2, 3, -1]
import math
print([math.sqrt(n) for n in mylist if n > 0])
# [1.0, 2.0, 3.1622776601683795, 1.4142135623730951, 1.7320508075688772]

另外一个值得关注的过滤工具就是 itertools.compress(),它以一个 iterable 对象和一个对应的 Boolean 选择器序列作为输入参数。然后输出 iterable 对象中对应选择器为 True 的元素。当你需要用另外一个像关联的序列来过滤某个序列的时候，这个函数是非常有用的。比如，有下列两组数据：

addresses =[
    '5412 N CLARK',
    '5148 N CLARK',
    '5800 E 58TH',
    '2122 N CLARK',
    '5645 N RAVENSWOOD',
    '1060 W ADDISON',
    '4801 N BROADWAY',
    '1039 W GRANVILLE'
]

counts = [0, 3, 10, 4, 1, 7, 6, 1]

现在想将那些对应 count 值大于5的地址全部输出，那么可以这么做：

from itertools import compress

more5 = [n > 5 for n in counts]
print(more5)
# [False, False, True, False, False, True, True, False]
list(compress(addresses,more5))
# ['5800 E 58TH', '1060 W ADDISON', '4801 N BROADWAY']

这里的关键点在于先创建一个 Boolean 序列，指示哪些元素符合条件。然后 compress() 函数根据这个序列去选择输出对应位置为 True 的元素。
和 filter() 函数类似， compress()也是返回的一个迭代器。因此，如果需要得到一个列表，需要使用 list()来将结果转换为列表类型。

百无一用生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python cookbook 学习笔记第一章数据结构和算法(15)过滤序列元素

过滤序列元素-** 问题**有一个数据序列，想利用以些规则从中提取出来需要的值或者是缩短序列。解决方案：最简单的过滤序列元素的方法就是使用列表推导。比如：mylist = [1, 4, -5, 10, -7, 2, 3, -1][n for n in mylist if n &gt; 0] # [1, 4, 10, 2, 3][n for n in mylist ...
复制链接

扫一扫