有这样一个小小的练习题:
卖电子商品的老板,每天记录了自己卖出的U盘,电脑支架,插座,电池,音箱,鼠标,usb数据线,手机充电线等数量,客户的需求是一方面,也可以通过客户购买关联性比较强的商品进行引导,以提高销量,比如:客户买了无线鼠标,你可以向他卖电池。
有些是可以通过我们的常识判断,但是怎么通过数据,客观地发现商品之间有没有相关性。机器学习可以通过关联规则Apriori算法挖掘,没有机器学习算法基础,怎么用统计学知识解决,本案例分享给大家。
目 录
1、问题描述
2、导入外部包,加载数据
3、相关性分析
4、绘图展示
1、问题描述
(1)使用pandas读取文件"销售记录.xlsx"中的数据;
(2)对各产品之间的销售情况做相关分析;
(3)找出相关系数最大的两类产品;
(4)画出相关系数最大的两类产品销售情况的拆线图(一张图内,不同颜色);
(5)实验报告内容包括:问题描述、代码、运行结果以及实验感想;
2、导入外部包,加载数据
加载数据
可以按到,数据总共29行,每天一行,11列,包括10中在售商品。数据很整齐,没有缺失,全部是数值型。
3、相关性分析
相关性,可以通过计算两个变量之间的相关性系