python操作大文件

本文介绍了在Python中处理大文件的策略,包括使用`codecs.open`指定编码打开文件,以及针对大文件的读取方法如迭代读取、分块读取。通过对比,强调了分块读取在处理大文件时的效率优势,并提供了`seek()`函数用于文件定位的相关说明。
摘要由CSDN通过智能技术生成

        环境python3.6+win10

    python已经有很多现成的模块(如pandas)打开文件,我们能很轻易的根据编码打开文件得到我们需要的内容。但是有几个坑需要知道:1.不知道文件的编码如何打开文件;2.文件太大而只需要打开一部分如何快速打开文件;

    打开文件是大家都知道的。而一般推荐使用codecs.open用指定的编码打开文件。这样可以编码文件在打开写入的时候出现错误。这里我先介绍一下基础的操作文件模式:

 

w     以写方式打开,

a     以追加模式打开 (从 EOF 开始, 必要时创建新文件)

r+     以读写模式打开

w+     以读写模式打开 (参见 w )

a+     以读写模式打开 (参见 a )

rb     以二进制读模式打开

wb     以二进制写模式打开 (参见 w )

ab     以二进制追加模式打开 (参见 a )

rb+    以二进制读写模式打开 (参见 r+ )

wb+    以二进制读写模式打开 (参见 w+ )

ab+    以二进制读写模式打开 (参见 a+ )

 

打开文件需要注意的是是否报错和时候覆盖原来文件的问题。

 

复制代码

模式 可做操作 若文件不存在 是否覆盖
r 只能读 报错 -
r+ 可读可写 报错
w 只能写 创建
w+ 可读可写 创建
a 只能写 创建 否,追加写
a+ 可读可写 创建 否,追
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值