1.读取txt文件
打开文件:
file_path = 'file.txt'
f = open(file_path,mode='r')
mode为打开模式参数:‘r’表示只读模式,‘x’表示写模式(file_path为不存在的新路径),‘t’表示文本模式。
读取文件内容:
f.readline() #返回一行
f.readlines(size) #返回包含size行的列表,size未指定则返回全部行
for line in f:
print(line) #通过迭代器逐行访问
for i,line in enumerate(f):
print(i,line) #返回行的标签和内容
f.close() #关闭文件
2.读取csv文件
df = pd.read_csv(file_path,
encoding='gbk',
name=['','',''],
header=0)
pd.read_csv这个函数参数很多,这里列举了几个比较常用的,有其他需求可以查阅pandas的document。
file_path问必填参数,即文件路径;
encoding为编码方式,常用的有’utf-8‘,’gbk'。采用gbk编码的csv文件直接打开后内容肉眼可读,utf-8编码的文件直接打开后内容可能呈现乱码(部分office软件版本也可读);
names表示设置列名称,若不设置names参数,则默认用读取的第0行内容为列名称;
header表示从第几行开始读取数据,默认从文件第0行开始。