python数据挖掘-读书笔记(一)关联规则挖掘中Apriori算法与例子
导读
1.KDD过程:问题陈述、数据收集和储存、数据清理、数据挖掘、表示和可视化、问题解决。
2.频繁项集:若干个项的集合。在本篇文章中,频繁项集被延伸为购物篮。
3.支持度:先导与后继在一个项集中出现的频率。
4.置信度:同时包含先导和后继的项集的百分比除以只包含先导的项集的百分比。
5.关联规则:先举一个简单的例子。
香草威化 -> 香蕉,生奶油
[支持度 = 1%, 置信度 = 40%...
原创
2018-12-06 20:11:19 ·
983 阅读 ·
1 评论