python 输出文件总行数_如何使用python计算文本文件中的总行数

最新推荐文章于 2023-08-02 18:24:19 发布

云山雾村

最新推荐文章于 2023-08-02 18:24:19 发布

阅读量1.5k

点赞数

文章标签： python 输出文件总行数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28922227/article/details/114923593

版权

本文介绍了多种使用Python计算文本文件行数的方法，包括使用for循环、sum()函数结合生成器表达式，以及利用原始文件接口进行无缓冲读取等优化方案。针对大文件，文章还提供了一个使用itertools和原始文件读取的高效解决方案。

摘要由CSDN通过智能技术生成

例如，如果我的文本文件是：

blue

green

yellow

black

这里有四行，现在我想得到四个结果。我怎样才能做到这一点？

open('data.txt')as fp：for line in fp：if line.strip()：count + = 1

@alecxe会起作用吗？

是的，它会起作用，但解决方案不是pythonic，更好地使用sum()。

stackoverflow.com/questions/845058/绰绰有余;-)

如何在Python中廉价获取行数可能重复？

您可以将sum()与生成器表达式一起使用：

with open('data.txt') as f:

print sum(1 for _ in f)

请注意，您不能使用len(f)，因为f是一个迭代器。 _是一次性变量的特殊变量名，请参阅Python中单个下划线"_"变量的用途是什么？

您可以使用len(f.readlines())，但这会在内存中创建一个额外的列表，甚至不适用于不适合内存的大文件。

所以pythonic，非常pythonic：O

如果你用open('data.txt')把它写成f：print sum([1 for _ in f])，它会更加迅速吗？

@jimh - 最好只使用sum(1 for _ in f)因为它隐含地使用括号内的生成器表达式而不创建1的列表。但是，您的版本sum([1 for _ in f])会在对它们求和之前创建一个1的列表，这会不必要地分配内存。

@blokeley以牺牲内存为代价更快是我的问题

@jimh这里没有这样的权衡。生成器表达式将减少，因为它不必花时间分配内存。理解可以是优化，以防您可以重用已分配的列表或字典。

这个链接(如何在Python中廉价地获得行数？)有很多潜在的解决方案，但它们都忽略了一种方法，使运行速度更快，即使用无缓冲(原始)接口，使用bytearrays，并进行自己的缓冲。

使用修改版本的计时工具，我相信以下代码比任何提供的解决方案更快(并且更加pythonic)：

def _make_gen(reader):

b = reader(1024 * 1024)

while b:

yield b

b = reader(1024*1024)

def ra

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。