Python读写超大文件

最新推荐文章于 2024-08-19 17:47:49 发布

小小臭臭g

最新推荐文章于 2024-08-19 17:47:49 发布

阅读量1.7k

点赞数

分类专栏：面试题

原文链接：https://mp.weixin.qq.com/s?__biz=MzIzMzMzOTI3Nw==&mid=2247484905&idx=1&sn=7de0eaab0a4c9f8b44cba01d28ad7254&source=41#wechat_redirect

版权

面试题专栏收录该内容

16 篇文章 0 订阅

订阅专栏

1G内存读取10G文件

方法1(生成器读取):

原文章链接


# 1G内存读取10G的文件
def chunked_file_reader(fp, block_size=1024 * 8):
    """生成器函数：分块读取文件内容"""
    while True:
        chunk = fp.read(block_size)
        # 当文件没有更多内容时，read 调用将会返回空字符串 ''
        if not chunk:
            break
        yield chunk

# 写法2
# from functools import partial
# def chunked_file_reader(file, block_size=1024 * 8):
#     """生成器函数：分块读取文件内容，使用 iter 函数"""
#     # 首先使用 partial(fp.read, block_size) 构造一个新的无需参数的函数
#     # 循环将不断返回 fp.read(block_size) 调用结果，直到其为 '' 时终止
#     for chunk in iter(partial(file.read, block_size), ''):
#         yield chunk


def count_nine_v3(fname):
    count = 0
    with open(fname, encoding="utf-8") as fp:
        for chunk in chunked_file_reader(fp, 10):
            print(chunk)  # todo 处理文件内容
            count += chunk.count('=')  # 计算文件中有多少个"="
    return count


# print(count_nine_v3("requesment.txt"))
print(count_nine_v3("oneline.txt"))