挖掘频繁项集

最新推荐文章于 2024-04-30 17:28:01 发布

weixin_34245169

最新推荐文章于 2024-04-30 17:28:01 发布

阅读量142

点赞数

文章标签：数据结构与算法

原文链接：http://www.cnblogs.com/yttas/p/9991667.html

版权

一，Apriori算法

Apriori算法的基本思路：

产生L1候选集，剪枝（去掉L1里面不符合最小支持度的），连枝产生L2候选集，剪枝（去掉候选集不在数据集里的和不满足最小支持度的），产生L3。。。直到不能再产生新的候选集（具体判定就是连枝的时候，k-2项集不存在，这时不能生成k项集）

算法中需要注意的细节

为了在统计L1候选集的频次的时候，能把L1作为字典的健，要把L1进行frozenset。用map()函数，把list里面的每一个元素都转换成set，转换之后会有重复的set（set的不重复性指的是set内部）。

if a.issubset(b)：如果a是b里面的子集则返回为真

数据集要预处理转换成set形式，这样才能保证数据集的安全性

对于两个游标的（一般用于集合内的排列组合）：

for i in range(len):
    for j in range(i+1,len)

前k-2项是list[:k-2]，冒号别忘了

转载于:https://www.cnblogs.com/yttas/p/9991667.html

weixin_34245169

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
挖掘频繁项集

一，Apriori算法Apriori算法的基本思路：产生L1候选集，剪枝（去掉L1里面不符合最小支持度的），连枝产生L2候选集，剪枝（去掉候选集不在数据集里的和不满足最小支持度的），产生L3。。。直到不能再产生新的候选集（具体判定就是连枝的时候，k-2项集不存在，这时不能生成k项集）算法中需要注意的细节为了在统计L1候选集的频次的时候，能把L1作为字...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。