关联规则算法c语言样例及分析_【视频】Rapidminer关联规则和文本挖掘模型对评论数据进行分析...

原文链接:

拓端数据科技 / Welcome to tecdat​tecdat.cn
4accfa4c28b8e07a2584bef26de649d4.png

76f240c63de42f5e8443d49e286aa7f0.png

关联规则是if / then语句,可帮助发现看似无关的数据之间的关系。关联规则的一个示例是“如果客户购买鸡蛋,那么他有80%的可能性也购买牛奶”。关联规则包含两个部分,一个前提(if)和一个后果(then)。前项是在数据中找到的一个或多个项目。结果就是与前项组合在一起的项(或项集)。

关联规则是通过分析频繁使用的“如果/然后”模式的数据并使用条件 支持置信度 来确定最重要的关系来创建的。支持表示项目在数据库中出现的频率。置信度表示发现if / then语句为真的次数。使用FP-Growth运算符之类的运算符来挖掘频繁的if / then模式。“创建关联规则”运算符采用这些频繁项集并生成关联规则。

这样的信息可以用作关于诸如促销价格或产品安置的市场活动的决定的基础。除了上述来自市场篮子分析的示例外,当今在许多应用程序领域中都采用了关联规则,包括Web使用挖掘,入侵检测和生物信息学。

知乎视频​www.zhihu.com

视频
在这个短片中我们分享了如何使用RAPIDMINER创建关联规则和文本挖掘模型对评论数据进行分析

876bc9ffd1663adac1f6e52f80d268dd.png

输入项

  • 项目集(常用项目集)该输入端口需要频繁的项目集。诸如FP-Growth运算符之类的运算符可用于提供这些频繁项集。

输出量

  • 项目集(常用项目集)作为输入提供的项集将通过此端口传递,而不会更改为输出。这通常用于在其他运算符中重用相同的项目集,或在“结果”工作区中查看这些项目集。
  • 规则(关联规则)关联规则通过此输出端口传递。

参数

  • 条件此参数指定用于选择规则的条件。
    • 置信度:规则的置信度定义为conf(X表示Y)= supp(X∪Y)/ supp(X)。阅读表达式时要小心:这里supp(X∪Y)的意思是“支持X和Y都出现的交易的发生”,而不是“支持X或Y都出现的交易的发生”。置信度范围为0到1。置信度是Pr(Y | X)的估计值,即在给定X的情况下观察Y的概率。
    • 提升:规则的提升定义为提升(X表示Y)= supp(X∪Y)/((supp(Y)x supp(X))或观察到的支持度与预期支持度之比(如果X和Y提升也可以定义为lift(X表示Y)= conf(X表示Y)/ supp(Y).lift度量X和Y与独立性之间的距离。其范围在0到正无穷大之间。值接近1表示X和Y是独立的,规则并不有趣。
    • conv:conv对规则方向敏感,即conv(X表示Y)与conv(Y表示X)不同。conv定义为conv(X表示Y)=(1-supp(Y))/(1-conf(X表示Y))
    • 增益:选择此选项时,使用增益theta参数计算增益。
    • laplace:选择此选项时,使用laplace k参数计算Laplace。
    • ps:选择此选项后,将使用ps标准进行规则选择。

min_confidence此参数指定规则的最小置信度范围:实数

  • min_criterion_value此参数指定所选条件的规则的最小值范围:实数
  • gain_theta该参数指定 在增益计算中使用的参数 Theta范围:实数
  • laplace_k此参数指定 在Laplace函数计算中使用的参数 k。范围:实数

参考文献

1.探析大数据期刊文章研究热点

2.618网购数据盘点-剁手族在关注什么

3.r语言文本挖掘tf-idf主题建模,情感分析n-gram建模研究

4.python主题建模可视化lda和t-sne交互式可视化

5.r语言文本挖掘nasa数据网络分析,tf-idf和主题建模

6.python主题lda建模和t-sne可视化

7.Python中的Apriori关联算法市场购物篮分析

8.通过Python中的Apriori算法进行关联规则挖掘

9.python爬虫进行web抓取lda主题语义数据分析

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值