读写xlsx文件
有很多包都能读写xlsx文件,但使用下来还是openpyxl这个包最方便。
import openpyxl
# 读取文件
wb = openpyxl.load_workbook('data_useful.xlsx')
# 获取当前活跃的sheet,默认是第一个sheet
data_excel = wb.active
# 读取
# 读A1单元格的值
data = data_excel['A1'].value
# 写回
# 向A2单元格写值
data_excel['A2'].value = name_list
# 写文件的话,最后一定要保存文件,否则写回不会生效
# 保存文件
wb.save('data.xlsx')
读写tsv文件
tsv文件主要的特点就是使用的文本分隔符为制表符,而csv文件的分隔符为逗号
读取tsv
1.使用csv库读取tsv
import csv
with open('file.tsv') as f:
tsvreader = csv.reader(f, delimiter='\t')
for line in tsvreader:
print(line)
2.使用pandas库读取tsv
import pandas as pd
data = pd.read_csv('file.tsv', delimiter='\t')
写入tsv
# newline=''的作用主要是为了避免空行,如果不使用,那么每行数据后会多一行空行
with open(r'file.tsv', 'w', newline='') as f:
tsv_w = csv.writer(f, delimiter='\t')
# 单行写入
tsv_w.writerow([a, b, c])
# 多行写入
tsv_w.writerows(np.array(data).tolist())
读写csv文件
读写csv相对简单,都有现成的工具包
读取csv——使用pandas
import pandas as pd
# 数据读入
data = pd.read_csv('data.csv', encoding='gbk') # encoding为指定读取的编码,在读取文件错误时可以换一种编码方式读取
写回csv——使用pandas
import pandas as pd
# 数据写回
data_copy.to_csv('data.csv',index=None) # index为是否加入索引列,默认加