只想说,数据挖掘工作,80%时间都花在处理数据上了,这句话真不假!
最近和小伙伴组了个队参加数据分析比赛,记录下我处理 csv 文件的一些步骤吧:
修改csv文件
import pandas as pd
import csv
city_class={1:['北京','上海','重庆','天津'],2:['成都','大连','沈阳'],3:['长春']}
with open('city_test.csv','r+') as f:
f.readline()
data=csv.reader(f)
rows=[r for r in data]
print(rows)
for i in rows:
for key,values in city_class.items():
if i[0] in values:
i[0]=key
writer = csv.writer(open('output.csv', 'w'))