python生成器实现大文件读取

本文介绍如何利用Python生成器实现大文件的读取,避免因文件过大导致的内存问题。通过使用`read(n)`方法,每次读取指定字节数,如`read(4096)`,实现按需读取,从而有效管理内存。文章将展示具体的生成器实现过程。
摘要由CSDN通过智能技术生成

python生成器实现大文件读取

python读取文件其实很容易,可是如果文件过于庞大内存是做不到的。
小的文件用简单的for 循环同样也是做不到的

在这里插入图片描述
同样 简单的readlines也是不行的
在这里插入图片描述

现在我们来学习一个重要的知识点

read(n)
read函数里面可以加数字 ,每次读取n个字节
例如
read(4096)
意味着每次读取4096个字节

f = open()
f.read(4096)
f.read(4096)

而且这样每次都会从提取到的最后一个字符往下数
Ok,那我们现在来实现这个生成器
#读取大文件

def readmylines(f,mewline):
    buf = ""
    while True:
        while newline in buf:
            pos = buf.index(newline)#找到字符的位置
            yield buf[:pos]
            buf = buf[pos+len(newline):]
        chunk = f.read(4096*5)#读取相应的字符长度
        if not chunk:
            #说明已经读到文件结尾
            yield buf
            break
        buf += chunk

with open("input.txt")as f:
    #假设以||分割段落
    for line in readmylines(f,'||'):
        print(line)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值