Excel文件格式主要有csv,xlsx和xlsx,对于不同的格式,我们使用不同的包来进行处理。
使用csv包处理csv文件
读取csv文件
import csv
with open('./data.csv', 'r', newline='', encoding='utf-8-sig') as csvfile:
spamreader = csv.reader(csvfile)
for row in spamreader:
print(row)
其中,encoding='utf-8-sig'是为了编码正常可以正确显示中文,spamreader中的每一个row为list格式,可以循环取出每个单元格的值。
写入csv文件
import csv
with open('./data.csv', 'w', newline='', encoding='utf-8-sig') as csvfile:
spamwriter = csv.writer(csvfile)
spamwriter.writerow(['HELLO', 'WORLD'])
spamwriter.writerows([('SuiXin', 'Blog'), ('https://suixinblog.cn', '2019', 'CSV', '文件')])
结果:
image
注:使用delimiter参数来指定数据的分隔符,默认为,。
使用pandas包读写csv数据文件
如果csv文件是数据类的,那么使用pandas包读写数据会更方便。
读取csv数据存入DataFrame对象中
import pandas as pd
df = pd.read_csv("hou_all.csv", header=None, names=["CRIM", "ZN", "INDUS", "CHAS", "NOX", "RM", "AGE", "DIS", "RAD", "TAX", "PTRATIO", "B", "LSTAT