import pandas as pd
data = pd.read_csv (u"C:\\Users\\...\\data.csv" , header=0, encoding = "GBK")
new = pd.DataFrame()
for column in ['销量','金额']:
#'score_hownet','score_boson','score_1how','score_1bos','score_howbos','score_alldict']:
grouped = data[column].groupby(data['编码']) # 以 编码 为key 求和
dfnew=grouped.sum()
new[column]=dfnew
new=new.reset_index() # 将 编码 ,从index中放入列中
data=data.drop(['商品编码','商品名称','库存','销量','金额'], axis=1)
newdata=data.drop_duplicates(['编码','店铺名称'],'first',False)
newdata = pd.merge(newdata,new,on='编码')
newdata.to_csv('newdata.csv', sep=',', header=True)
在处理数据过程中遇到了一定需求,借助几个函数有效解决了。
需求,也即要解决的问题如下:
1.读取已知csv文件