过滤序列元素

你有一个数据序列,想利用一些规则从中提取出需要的值或者是缩短序列

一般做法采用列表推导式

mylist = [1, 4, -5, 10, -7, 2, 3, -1]
list=[num for num in mylist if num >0]
print(list)
打印结果:[1, 4, 10, 2, 3]

使用列表推导的一个潜在缺陷就是如果输入非常大的时候会产生一个非常大的结果集,占用大量内存。如果你对内存比较敏感,那么你可以使用生成器表达式迭代产生过滤的元素

mylist = [1, 4, -5, 10, -7, 2, 3, -1]
pos=(num for num in mylist if num >0)
print(pos)
打印结果:<generator object <genexpr> at 0x000002030E4615F0>

可以通过for循环,将元素迭代出来
for i in pos:
	print(i)

有的序列过滤规则比较复杂,不能简单的在列表推导或者生成器表达式中表达出来。比如,假设过滤的时候需要处理一些异常或者其他复杂情况。这时候你可以将过滤代码放到一个函数中,然后使用内建的 filter() 函数
filter() 函数创建了一个迭代器,因此如果你想得到一个列表的话,就得像示例那样使用 list() 去转换。

values = ['1', '2', '-3', '-', '4', 'N/A', '5']
def is_int(val):
    try:
        x=int(val)
        return True
    except ValueError:
        return  False

a=list(filter(is_int,values))
print(a)
打印结果:['1', '2', '-3', '4', '5']

过滤操作的一个变种就是将不符合条件的值用新的值代替,而不是丢弃它们。比如,在一列数据中你可能不仅想找到正数,而且还想将不是正数的数替换成指定的数。通过将过滤条件放到条件表达式中去,可以很容易的解决这个问题

mylist = [1, 4, -5, 10, -7, 2, 3, -1]
clip_neg = [n if n > 0 else 0 for n in mylist]
打印结果:[1, 4, 0, 10, 0, 2, 3, 0]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值