java实现频繁集_数据挖掘--频繁集测试--Apriori算法--java实现

最新推荐文章于 2023-05-24 21:35:37 发布

爱吃糖的苏苏雅

最新推荐文章于 2023-05-24 21:35:37 发布

阅读量202

点赞数

文章标签： java实现频繁集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32243309/article/details/114858541

版权

本文介绍了关联规则挖掘中的Apriori算法，并提供了Java核心代码实现，用于找出数据集中的频繁项集。算法通过合并与修剪过程，基于最小支持度条件挖掘频繁模式。

摘要由CSDN通过智能技术生成

[ 关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从� ...]

2013年11月19日注：以下算法中，combine算法实现不正确，应该是从已有的频繁中来产生。需要进一步修改

=================================================================================

Apriori算法原理：

如果某个项集是频繁的，那么它所有的子集也是频繁的。如果一个项集是非频繁的，那么它所有的超集也是非频繁的。

示意图

图一：[频繁模式是频繁地出现在数据集中的模式(如项集、子序列或者子结构)。例如，频繁地同时出现在交易数据集中的商品(如牛奶和面包)的集合是频繁项集。]

图二：

package cn.ffr.frequent.apriori;

import java.io.BufferedReader;

import java.io.InputStreamReader;

import java.net.URL;

import java.util.ArrayList;

import java.util.HashMap;

import java.util.HashSet;

import java.util.List;

import java.util.Map;

import java.util.Set;

/**

* Apriori的核心代码实现

* @author neu_fufengrui@163.com

*/

public class Apriori {

public static final String STRING_SPLIT = ",";

/**

* 主要的计算方法

* @param data 数据集

* @param minSupport 最小支持度

* @param maxLoop 最大执行次数，设NULL为获取最终结果

* @param containSet 结果中必须包含的子集

* @return

*/

public Map compute(List data, Double minSupport, Integer maxLoop, String[] containSet){

//校验

if(data == null || data.size() <= 0){

return null;

}

//初始化

Map result

最低0.47元/天解锁文章

爱吃糖的苏苏雅

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
java实现频繁集_数据挖掘--频繁集测试--Apriori算法--java实现

[ 关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从� ...]2013年11月19日注：以下算法中，combine算法实现不正确，应该是从已有的频繁中来产生。需要进一步修改=====================================================================...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。