泰迪杯数据分析比赛2018年B题解答-任务3

泰迪杯数据分析比赛2018年B题解答-任务3


泰迪杯数据地址: https://www.tipdm.org/bdrace/jljingsai/20181008/1488.html#sHref.
泰迪杯数据分析2018年B题任务3题目:

任务 3.1 分析各售货机商品销售数据,总结规律,给出每台售货机饮料类商品的标签,结果保存在 CSV 文件中,文件名分别为 “task3-1A.csv”、 “task3-1B.csv”、…、“task3-1E.csv”,格式如下表所示。
显视图片
任务 3.2 在任务 3.1 的基础上进行标签拓展,依据标签生成完整的售货机画像,结果保存在 CSV 文件中,文件名分别为“task3-2A.csv”、task3- 2B.csv”、…、“task3-2E.csv”。依据此画像进行总结描述,给出营销意见。


任务3.1

分析各售货机商品销售数据,总结规律,给出每台售货机饮料类商品的标签,结果保存在 CSV 文件中,文件名分别为 “task3-1A.csv”、 “task3-1B.csv”、…、“task3-1E.csv”,格式如下表所示。
显视图片

目标:得出各售货机商品销售数据,并对各商品进行分类贴标签。

分析:首先我们得对各售货机的各商品销售量进行统计,然后使用聚类算法对商品进行分类。在此聚类算法中,我将会使用KMeans聚类算法。

首先我们需要对A-E五台售货机进行数据整理,将各商品的总实际金额与销售量制作成表单。
实现代码:

import pandas as pd
data=pd.read_csv(r'D:\大数据学习\数据分析与挖掘\B题\task1-A.csv',encoding='gbk')
dalei=data['商品'].unique().tolist()#提取出商品总列表,方便之后进行分类
dalei
datasum=[]
datasem=[]
for i in dalei:
    data_x=data[data['商品']==i]['实际金额'].sum()
    data_t=data[data['商品']==i]['商品'].size
    datasum.append(data_x)#插入列表中
    datasem.append(data_t)
task1_2 = pd.DataFrame({
   '商品':dalei,'总实际金额':datasum,'销售量':datasem})#对列表进行整理,制作成表单
task1_2.sort_values(by=
  • 6
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值