spark关联规则挖掘

最新推荐文章于 2024-05-01 20:48:21 发布

Jerry_Mining

最新推荐文章于 2024-05-01 20:48:21 发布

阅读量886

点赞数

分类专栏：数据分析挖掘 spark

本文链接：https://blog.csdn.net/Jerry_Mining/article/details/78274582

版权

该博客介绍了如何使用Spark的mllib库进行关联规则挖掘，主要包括将数据转化为分类变量和应用FPGrowth算法。然而，操作过程中遇到了数据转换为sparse格式（basket格式）的需求，以及因版本问题导致的报错问题。

摘要由CSDN通过智能技术生成

使用spark进行关联规则挖掘：

1 首先数据全部处理为分类变量

2 使用spark mllib 中的FPGrowth挖掘关联规则

存在问题

1 数据需要处理成sparse格式，也有人称basket格式

2 版本原因会报错：

java.lang.IllegalArgumentException: Can not set 
final scala.collection.mutable.ListBuffer field org.apache.spark.mllib.fpm.FPTree$Summary.nodes to scala.collection.mutable.ArrayBuffer
Serialization trace:
nodes (org.apache.spark.mllib.fpm.FPTree$Summary)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Jerry_Mining

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark关联规则挖掘

使用spark进行关联规则挖掘：1 首先数据全部处理为分类变量2 使用spark mllib 中的FPGrowth挖掘关联规则存在问题1 数据需要处理成sparse格式，也有人称basket格式2 版本原因会报错：java.lang.IllegalArgumentException: Can not set final scala.collection.mutab
复制链接

扫一扫