环境python3.6+win10
python已经有很多现成的模块(如pandas)打开文件,我们能很轻易的根据编码打开文件得到我们需要的内容。但是有几个坑需要知道:1.不知道文件的编码如何打开文件;2.文件太大而只需要打开一部分如何快速打开文件;
打开文件是大家都知道的。而一般推荐使用codecs.open用指定的编码打开文件。这样可以编码文件在打开写入的时候出现错误。这里我先介绍一下基础的操作文件模式:
w 以写方式打开,
a 以追加模式打开 (从 EOF 开始, 必要时创建新文件)
r+ 以读写模式打开
w+ 以读写模式打开 (参见 w )
a+ 以读写模式打开 (参见 a )
rb 以二进制读模式打开
wb 以二进制写模式打开 (参见 w )
ab 以二进制追加模式打开 (参见 a )
rb+ 以二进制读写模式打开 (参见 r+ )
wb+ 以二进制读写模式打开 (参见 w+ )
ab+ 以二进制读写模式打开 (参见 a+ )
打开文件需要注意的是是否报错和时候覆盖原来文件的问题。
模式 | 可做操作 | 若文件不存在 | 是否覆盖 |
r | 只能读 | 报错 | - |
r+ | 可读可写 | 报错 | 是 |
w | 只能写 | 创建 | 是 |
w+ | 可读可写 | 创建 | 是 |
a | 只能写 | 创建 | 否,追加写 |
a+ | 可读可写 | 创建 | 否,追 |