文件操作
-
文件路径:在windows系统中,文件路径中使用反斜杠\
- 绝对路径
- 相对路径
-
编码方式:utf-8、gbk等
- Windows操作系统默认字符编码为gbk,而Python默认utf-8
-
gbk:一个中文用两个字节;utf-8:一个中文用三个字节
- 以什么编码方式存储的文件就要以什么编码打开,否则会报错或者乱码
-
操作方式:只读、只写、追加、读写、写读等
-
打开文件就一定要关闭文件
只读:
r:读取文件数据
# filepath为读取文件所在的路径
f = open(filepath,mode='r',encoding='utf-8') # mode的默认值是'r'
content = f.read()
print(content) # content的类型是字符串
f.close()
rb:用二进制方式读取
- 在读取二进制文件操作时,Python会将字节\x1A转换成的字符为文档结束符(EOF),从而可能会出现文档读取不全的情况,此时采用rb读取方式,且不需要encoding的值了。
- 对于非文字类型的文件,或者上传、下载用rb方式读取
f = open(filepath,mode='rb')
只写
w:写入文件
对于写操作,如果filepath不存在,也就是文件不存在,会在指定路径下创建文件;如果文件存在,就会将文件里面原有内容全部清除,再填写新的内容。
# filepath为新写的文件的路径
f = open(filepath,mode='w',encoding='utf-8')
f.write('hhh') # 'hhh'为我们想要填写的内容
f.close()
wb:以二进制方式写入文件
f = open(filepath,mode='wb')
f.write('你好'.encode('utf-8'))
f.close()
因为填写的内容 ‘你好’ 是字符串形式,不是bytes,因此用encode转换成utf-8
追加
a:在文件尾部添加内容
f = open(filepath,mode='a',encoding='utf-8')
f