python学习笔记——IO编程os模块open()方法的使用
【根据廖雪峰的教程整理】
学习目标:
学会用python读写文件,对相关内容进行操作
学习要点:
1、读文件
>>> f = open('/Users/michael/test.txt', 'r')
>>> f.read()
>>> f.close()
由于文件读写时都有可能产生IOError,一旦出错,后面的f.close()就不会调用。所以,为了保证无论是否出错都能正确地关闭文件,我们可以使用try … finally来实现:
try:
f = open('/path/to/file', 'r')
print(f.read())
finally:
if f:
f.close()
每次这么写太麻烦,所以,python引入with语句来自动帮我们调用close()方法:
with open('/path','r') as f:
print(f.read())
调用read()会一次性读取文件的全部内容,如果文件有10G,内存就爆了,所以,要保险起见,可以反复调用read(size)方法,每次最多读取size个字节的内容。另外,调用readline()可以每次读取一行内容,调用readlines()一次读取所有内容并按行返回list。因此,要根据需要决定怎么调用。
如果文件很小,read()一次性读取最方便;如果不能确定文件大小,反复调用read(size)比较保险;如果是配置文件,调用readlines()最方便:
for line in f.readlines():
print(line.strip()) # 把末尾的'\n'删掉
二进制文件用read(’\path’,‘rb’)来读取
2、字符编码
以’gbk’进行解码,然后忽略编码错误
>>> f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')
3、写文件
类似读文件
>>> f = open('/Users/michael/test.txt', 'w')
>>> f.write('Hello, world!')
>>> f.close()
with open('/Users/michael/test.txt', 'w') as f:
f.write('Hello, world!')
以’w’模式写入文件时,如果文件已存在,会直接覆盖(相当于删掉后新写入一个文件)。如果我们希望追加到文件末尾怎么办?可以传入’a’以追加(append)模式写入
练习与问题
1、尝试从本地电脑桌面读取一个txt文本文件
f = open(r'C:\Users\keda\Desktop\installer-20201109-152119486.log','r')
print(f.readlines())
报错
发生异常: UnicodeDecodeError
‘gbk’ codec can’t decode byte 0xbf in position 2: illegal multibyte sequence
File “E:\python代码\learn.py”, line 1218, in
print(f.readlines())
错误的意思是:Unicode的解码(Decode)出现错误(Error)了,以gbk编码的方式去解码(该字符串变成Unicode),但是此处通过gbk的方式,却无法解码(can’t decode )。“illegal multibyte sequence”意思是非法的多字节序列,即没法(解码)了。
因为文本是以UTF-8编码方式存储的,所以解码不能用默认gbk来进行解码,所以指定解码方式为UTF-8之后错误解决
f = open(r'C:\Users\keda\Desktop\test.txt','r',encoding='UTF-8')
print(f.readlines())
返回一个按行读取文本的list
此处犯了一个错误,没有关闭文件,后续会导致无法写入
f = open(r'C:\Users\keda\Desktop\test.txt','r',encoding='UTF-8')
print(f.readlines())
f.close()
2、把1-10依次换行写入test.txt中,完成后读取一次文件的内容
n = 0
while True:
if n == 10:
with open(r'C:\Users\keda\Desktop\test.txt','r') as f:
print(f.read())
break
with open(r'C:\Users\keda\Desktop\test.txt','a') as f:
f.write(str(n+1)+'\n')
n += 1
运行一次后
没有问题
小结
记住使用with来打开文件对象进行操作
with open('\path','r/w/x/a') as f:
pass
养成习惯,避免没有关闭文件导致程序报错。