Python语言学习讲解十一:生成器表达式改写较大的列表推导

注:每周一到周五都会进行相关Python基础知识更新,欢迎大家提宝贵的意见

列表推导的缺点是:在列表推导过程中,对于输入序列中的每个值来说,可能都要创建仅含一项元素的全新列表。当输入的数据比较少时,不会出现问题。但如果输入数据非常多,那么可能会消耗大量内存,并导致程序崩溃。

ge:

要读取一份文件并返回每行的字符数。若采用列表推导式来做,则需要把文件每一行的长度都保存在内存中。如果这个文件特别大,那么这种列表推导式就会出现问题。

ml = [len(x) for x in open('/tem/my_file.txt')]

print ml

>>>[28,37,43,5,6,7]

为了解决此问题,python提供了生成器表达式(generator expression),它是对列表推导和生成器的一种泛化。生成器表达式在运行的时候,并不会把整个输出序列都呈现出来,而是会估值为迭代器(iterator),这个迭代器每次都可以根据生成器表达式产生一项数据

*****把实现列表推导式所使用的那种写法放在一对圆括号中,就构成了生成器表达式。******

二者的区别在于:

对生成器表达式求值的时候,他会立即返回一个迭代器,而不会深入处理文件中的字符。

>>> it = (len(x) for x in ['aaaa','bbbbb'])
>>> it
<generator object <genexpr> at 0x028BFC88>

以刚才返回的it迭代器为参数,调用内置函数next(),即可使其按着生成器表达式来输出一个值。多次命令迭代器根据生成表达式来生成新值,而不用担心内存用量激增。

>>> print next(it)
4
>>> print next(it)
5
>>> print next(it)


Traceback (most recent call last):
  File "<pyshell#79>", line 1, in <module>
    print next(it)
StopIteration

使用生成器表达是还有个好处是:可以相互结合。

its = ((x, x**2) for x in it)##注意此处的it为可迭代对象哦

print next(its)

最后需要注意一点就是:由生成器表达式所返回的那个迭代器是有状态的,用过一轮之后,就不要重复使用了。



总结:

1、当输入的数据量较大时,列表推导式可能会因为占用太多内存而出现问题

2、由生产器表达式所返回的迭代器,可以逐次产生输出值,从而避免了内存用量问题

3、可以进行结合使用

4、串在一起的生成器表达式执行速度很快

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

隨意的風

如果你觉得有帮助,期待你的打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值