Python 读取大文件的方法,Python读取文件报错:MemoryError

创建一个3G大小的word文件,创建方法参考:如何快速生成一个指定大小的txt、word文件

import datetime
f = open(r'C:\Users\songlihui\PycharmProjects\test002django\apps\1.doc')
t = open(r'C:\Users\songlihui\PycharmProjects\test002django\apps\6.doc', 'w')
print(datetime.datetime.now())# 打印时间来看总共的耗时
while True:
    #处理该行的代码
    data = f.read(1024)# 使用read每次读取1024个
    if data:
        t.write(data)# 将从1.doc中读的内容写入到6.doc中
    else:
        print(datetime.datetime.now())
        break
print(datetime.datetime.now())# 打印结束时间

# 写成一个读取文件的函数
# def read_in_chunks(filePath, chunk_size=1024*1024):
#     file_object = open(filePath)
#     while True:
#         chunk_data = file_object.read(chunk_size)
#         if not chunk_data:
#             break
#         yield chunk_data
# if __name__ == "__main__":
#     filePath = r'C:\Users\songlihui\PycharmProjects\test002django\apps\1.doc'
#     print(datetime.datetime.now())
#     for chunk in read_in_chunks(filePath):
#         t.write(chunk)
#     print(datetime.datetime.now())

自测读取大文件使用的方法是read,网上搜索了很多文章参考。有人说也可以使用readline等,但是自测还是会报错提示内存溢出MemoryError。不过自测3G大小的文件,读和写入加起来的耗时在30s左右。效率并不是很高,不知道大家还有没有更好的方法,如果有欢迎留言评论探讨。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值