根据平时使用到的文件操作进行整理,有些需要待完善。
处理文本文件
处理txt、doc等选择使用python原始文件处理方法
1. 打开文件
file_obj =open(file,[mode='r’,buffering=1,encoding=None,errors=None,newline=None,closefd=True,opener=None])
- file:文件名,如果不在当前路径,需指出具体路径
- mode:打开文件的模式,具体见下图
- encoding:文件编码方式
- newline:换行符
注意:打开文件,对文件操作完成后要关闭文件close()才可以。
但可以使用with open() as f: 的形式,不需要写close,关键字with可以控制在不需要访问文件后将其关闭。
2. 读取文件
- read([size])
读出整个文件;如果有size参数,则读出size个字节 - readline([size])
读出一行 - readlines([size])
读取每一行,并将其存储在一个列表中
# read
with open('filename.txt') as f:
contents = f.read()
print(contents)
# readline
f = open('filename.txt')
f.readline() # 读取完一行后,指针跳转到下一行
f.readline() # 当再执行readline后,将读取第二行,依次类推
# 还有一种逐行读取的方法
with open('filename.txt') as f:
for line in f:
print(line)
# readlines
with open('filename.txt') as f:
lines = f.readlines()
for line in lines:
pring(line)
3. 写入文件
- write(str)
把str字符串写入 - writelines()
把字符串序列如列表、元组形式的写入文件
# write
with open('file.txt','w') as f:
f.write('hello world')
# writelines
ls = ['a','b','c','d']
with open('file.txt','w') as f:
f.writelines(ls)
处理csv,excel 文件
使用数据处理时经常使用的pandas库,pd.read_csv(),pd.to_csv(),pd.read_excel() ,pd.to_excel() 平时使用最多的,不做赘述。
pandas 可以读取很多类型的文件,如txt文件也可以使用read_table()等,但是在写出的时候会不方便。
excel办公自动化
对操作excel要求较高的,可以使用第三方库 openxl
后续补充
处理json文件
使用第三方库json
json.dumps() # 将python类型转换为json
json.loads() # 将json转换为python类型