对于csv文件的常用操作,比如求和,求平均值等,虽然可以直接用excel进行文件操作,但是如果csv文件有几百兆甚至有几个G的时候,用excel做统计是非常慢的,而且还会经常死机,一些数据产品经理经常为了跑数据加班到半夜,其实用python可以几行代码就能搞定
1、Python读取CSV文件
csv是Python内置的一个库,用来处理csv文件。
import csv
reader=csv.reader(open('40220_data.csv'))
for row in reader:
print(row)
其中row是一个list,每个元素代表每列的值
2、Python写入CSV文档
可以将数据以列表的形式写入:
import csv
header = ["name", "score"]
data = [["Wang", "100"],["Li", "80"]]
file = open("score.csv", "w")
writer = csv.writer(file)
writer.writerow(fileHeader)
for row in data:
writer.writerow(row)
file.close()