python生成器读取大文本文件_python生成器实现大文件读取

python生成器实现大文件读取

python读取文件其实很容易,可是如果文件过于庞大内存是做不到的。 小的文件用简单的for 循环同样也是做不到的

同样 简单的readlines也是不行的

现在我们来学习一个重要的知识点

read(n) read函数里面可以加数字 ,每次读取n个字节 例如 read(4096) 意味着每次读取4096个字节

f = open()

f.read(4096)

f.read(4096)

而且这样每次都会从提取到的最后一个字符往下数 Ok,那我们现在来实现这个生成器 #读取大文件

def readmylines(f,mewline):

buf = ""

while True:

while newline in buf:

pos = buf.index(newline)#找到字符的位置

yield buf[:pos]

buf = buf[pos+len(newline):]

chunk = f.read(4096*5)#读取相应的字符长度

if not chunk:

#说明已经读到文件结尾

yield buf

break

buf += chunk

with open("input.txt")as f:

#假设以||分割段落

for line in readmylines(f,'||'):

print(line)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值