泰迪杯数据分析比赛2018年B题解答-任务3补充3.2
任务3-文章目录
泰迪杯数据地址: https://www.tipdm.org/bdrace/jljingsai/20181008/1488.html#sHref.
前言:由于许多码友咨询3.2的任务代码,因此为了实现码友们的期望,特此补充3.2的实现代码。
任务 3.2 在任务 3.1 的基础上进行标签拓展,依据标签生成完整的售货机画像,结果保存在 CSV 文件中,文件名分别为“task3-2A.csv”、task3- 2B.csv”、…、“task3-2E.csv”。依据此画像进行总结描述,给出营销意见。
因为任务3.2是基于任务3.1的代码,因此先展现出3.1的代码:
3.1全部代码:
import pandas as pd
from sklearn.cluster import KMeans
from sklearn import metrics
from sklearn import preprocessing
def task9(data):
data1=pd.read_csv(r'D:\大数据学习\数据分析与挖掘\B题\\'+data,encoding='gbk')
dalei=data1['商品'].unique().tolist()#提取出商品总列表,方便之后进行分类
datasum=[]
datasem=[]
for i in dalei:
data_x=data1[data1['商品']==i]['实际金额'].sum()
data_t=data1[data1['商品']==i]['商品'].size
datas