![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
逝去abcde
这个作者很懒,什么都没留下…
展开
-
数据挖掘 | 亲和性分析(一)
首先解释一下什么是亲和性 举一个简单的例子:当顾客在购买一件商品时,往往还会购买另一件商品。比如我们买了面包就还会买牛奶,买了刀就还会买叉子等等。也就是说,顾客买了商品A,还会购买商品B,这就是亲和性的简单例子 那么,亲和性分析就是对这种规律进行分析,商家就可以将这些同时购买的物品放在一起以提升销售额啦。当然,实际上的应用远远不止这些。亲和性分析其实就是根据样本个体之间的相似度,确定它们关系的...原创 2018-09-17 23:44:23 · 1135 阅读 · 0 评论 -
数据挖掘 | 亲和性分析(二)
上回讲了亲和性分析的简单分析,但只计算了一条规则的支持度和置信度,现在来说说怎么计算所有规则的支持度和置信度 数据挖掘 | 亲和性分析(一) 首先先创建字典,分别创建有效规则字典、无效规则字典以及条件相同的规则数量 # 创建字典,存储规则有效数据及无效数据 from collections import defaultdict valid_rules = defaultdict(int) in...原创 2018-09-18 22:10:26 · 544 阅读 · 0 评论 -
数据挖掘 | 亲和性分析(三)
上回已经计算出了所有规则的支持度和置信度,并存为字典,那么,这次来进行排序 数据挖掘 | 亲和性分析(一) 数据挖掘 | 亲和性分析(二) 既然统计出所有规则的支持度和置信度,那么我们就想知道到底哪一条规则是支持度或置信度最高的,以便商家分析出顾客的习惯。首先我们要给支持度和置信度字典进行排序 这里需要用到operator模块的itemgetter函数 # 对支持度字典进行排序 from op...原创 2018-09-25 21:58:36 · 711 阅读 · 0 评论