你有一个数据序列,想利用一些规则从中提取出需要的值或者是缩短序列
一般做法采用列表推导式
mylist = [1, 4, -5, 10, -7, 2, 3, -1]
list=[num for num in mylist if num >0]
print(list)
打印结果:[1, 4, 10, 2, 3]
使用列表推导的一个潜在缺陷就是如果输入非常大的时候会产生一个非常大的结果集,占用大量内存。如果你对内存比较敏感,那么你可以使用生成器表达式迭代产生过滤的元素
mylist = [1, 4, -5, 10, -7, 2, 3, -1]
pos=(num for num in mylist if num >0)
print(pos)
打印结果:<generator object <genexpr> at 0x000002030E4615F0>
可以通过for循环,将元素迭代出来
for i in pos:
print(i)
有的序列过滤规则比较复杂,不能简单的在列表推导或者生成器表达式中表达出来。比如,假设过滤的时候需要处理一些异常或者其他复杂情况。这时候你可以将过滤代码放到一个函数中,然后使用内建的 filter() 函数
filter() 函数创建了一个迭代器,因此如果你想得到一个列表的话,就得像示例那样使用 list() 去转换。
values = ['1', '2', '-3', '-', '4', 'N/A', '5']
def is_int(val):
try:
x=int(val)
return True
except ValueError:
return False
a=list(filter(is_int,values))
print(a)
打印结果:['1', '2', '-3', '4', '5']
过滤操作的一个变种就是将不符合条件的值用新的值代替,而不是丢弃它们。比如,在一列数据中你可能不仅想找到正数,而且还想将不是正数的数替换成指定的数。通过将过滤条件放到条件表达式中去,可以很容易的解决这个问题
mylist = [1, 4, -5, 10, -7, 2, 3, -1]
clip_neg = [n if n > 0 else 0 for n in mylist]
打印结果:[1, 4, 0, 10, 0, 2, 3, 0]