Python读写超大文件

1G内存读取10G文件

方法1(生成器读取):

原文章链接


# 1G内存读取10G的文件
def chunked_file_reader(fp, block_size=1024 * 8):
    """生成器函数:分块读取文件内容"""
    while True:
        chunk = fp.read(block_size)
        # 当文件没有更多内容时,read 调用将会返回空字符串 ''
        if not chunk:
            break
        yield chunk

# 写法2
# from functools import partial
# def chunked_file_reader(file, block_size=1024 * 8):
#     """生成器函数:分块读取文件内容,使用 iter 函数"""
#     # 首先使用 partial(fp.read, block_size) 构造一个新的无需参数的函数
#     # 循环将不断返回 fp.read(block_size) 调用结果,直到其为 '' 时终止
#     for chunk in iter(partial(file.read, block_size), ''):
#         yield chunk


def count_nine_v3(fname):
    count = 0
    with open(fname, encoding="utf-8") as fp:
        for chunk in chunked_file_reader(fp, 10):
            print(chunk)  # todo 处理文件内容
            count += chunk.count('=')  # 计算文件中有多少个"="
    return count


# print(count_nine_v3("requesment.txt"))
print(count_nine_v3("oneline.txt"))

方法2:

原文链接
linux下的split 命令(将一个大文件根据行数平均分成若干个小文件)

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值