数据挖掘笔记-关联规则-FPGrowth-简单实现

人生偌只如初见

已于 2023-01-30 18:17:48 修改

阅读量3.2k

点赞数

分类专栏： DataMining 文章标签：关联分析关联规则 Apriori FPGrowth FPTree

于 2014-06-02 16:55:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fighting_one_piece/article/details/28111973

版权

FP-Growth算法作为Apriori的优化，通过频繁模式树（FPTree）减少对事务数据库的扫描次数，降低时间和空间复杂度。在关联分析中，FP-Growth比Apriori更高效，尤其适用于海量数据。为了进一步优化，可以采用数据库划分或数据采样等方法。

摘要由CSDN通过智能技术生成

由于Apriori算法需要多次扫描事务数据库，需要生成候选项集，大大增加了时间与空间的代价，FP Growth算法利用了巧妙的数据结构，大大降低了Aproir挖掘算法的代价，它不需要不断得生成候选项目队列和不断得扫描整个数据库进行比对。为了达到这样的效果，它采用了一种简洁的数据结构，叫做frequent-pattern tree(频繁模式树)。FP-growth算法比Apriori算法快一个数量级，在空间复杂度方面也比Apriori也有数量级级别的优化。对于海量数据，FP-growth的时空复杂度仍然很高，可以采用的改进方法包括数据库划分，数据采样等等。

FPGrowth算法的介绍与实例说明可以参考下面这个连接，里面讲的很详细。

http://hi.baidu.com/nefzpohtpndhovr/item/9d5c371ba2dbdc0ed1d66dca

Apriori和FP-Tree都是寻找频繁项集的算法，后面根据频繁项集产生关联规则都是一样的，就不再这里重复了。

FPGrowth算法Java简单实现:

public class FPGrowthBuilder {

	/** 最小支持度 */
	private int minSupport = 2;
	/** 频繁集集合*/
	private List<List<ItemSet>> frequencies = new ArrayList<List<ItemSet>>();
	
	//创建头表
	public List<FPTreeNode> buildHeadTables(Data data) {
		//统计各项出现频次
		Map<String, Integer> map = new HashMap<String, Integer>();
		for (Instance instance : data.getInstances()) {
			for (String value

最低0.47元/天解锁文章

人生偌只如初见

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

人生偌只如初见 CSDN认证博客专家 CSDN认证企业博客

码龄17年

153: 原创

2万+: 周排名

2万+: 总排名

50万+: 访问

: 等级

6074: 积分

630: 粉丝

182: 获赞

138: 评论

314: 收藏

私信

关注

热门文章

分类专栏

NebulaGraph 2篇
Doris 1篇
DataMining 49篇
Python 33篇
J2EE 26篇
ElasticSearch 14篇
Spark 12篇
XXL-JOB 3篇
Neo4j 4篇
Flink 2篇
Hadoop 6篇
ES-Hadoop 2篇
HBase 6篇
Hive 3篇
Tez 2篇
Kafka 5篇
Storm 3篇
JStorm 1篇
Tachyon 2篇
Oozie 1篇
Cassandra 1篇
Titan 2篇
Lucene 1篇
Redis 4篇
MongoDB 3篇
Akka 1篇
DataX 3篇
Crawler 4篇
Docker 3篇

最新评论

Java学习笔记-EXCEL文件的读写操作
qq_27475765: String sheetId = "rId1"; 这个rld1是怎么知道的。
Sanic学习笔记-搭建简单WEB基础框架
jeffreyshou: 老大，《Sanic学习笔记-搭建简单WEB基础框架》完整代码有吗？想学习下，谢谢
ElasticSearch学习笔记-Vector向量搜索记录
天津图芬奇: 搜索速度会根据数据规模线性增加，如果数据量大的话，不太可行，可以参考基于elasticsearch实现大规模向量检索这篇csdn博客，将向量搜索转成全文检索，搜索速度以及效率大大提升。
Neo4j学习笔记-Embedded嵌入模式简单示例
rainysky7: 请问作者有NEO4J的学习资源嘛，我想付费获取。最近在做一个用java开发后端的小项目，需要用NEO4J来做数据库，用java操作Neo4j，想找资料学习
Sanic学习笔记-搭建简单WEB基础框架
LaoYuanPython: 有幸阅读博主才出炉不到2天的大作！谢谢博主提供的案例代码分享!如此好文,点赞感谢！欢迎博主到本人的Python专栏来交流！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。