- 博客(1)
- 问答 (1)
- 收藏
- 关注
原创 教你手搓Apriori算法——Python实现(超详细!!!)
由于数据是二项集如:Health, Medicine,所以用iloc提取数据,再用“,”拆分,并选取第一个数据Health。在超市购物数据中,如果“牛奶”和“面包”这一组合经常一起出现在同一个购物篮里,并且出现的次数超过了最小支持度,那么{"牛奶", "面包"}就是一个频繁项集。如果在包含“牛奶”的所有交易中,有70%的交易也包含了“面包”,那么从“牛奶”到“面包”的置信度就是70%。如果我们有100笔交易,其中有30笔交易包含了“牛奶”,那么“牛奶”的支持度就是30%。它用于衡量一个项集的普遍性。
2024-06-01 12:14:55 923 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人