关联规则挖掘

关联规则挖掘是数据挖掘的一种方法,关注频繁项集和它们之间的关联规则。支持度衡量项集在数据库中出现的频率,而置信度表示规则发生的概率。 Apriori算法用于寻找频繁项集,通过不断组合和筛选,生成不同长度的项集。关联规则设计考虑了支持度、置信度和附加值,以确定规则的有效性和预测价值。
摘要由CSDN通过智能技术生成

参考文献:《python数据挖掘概念、方法与实践》第二章

频繁项集:在数据集中出现次数相对大的项目组合,有两个项目的项集成为2-项集或配对,有三个项目的项集成为3-项集或三元组

评价关联规则的好坏:数据库的支持程度、对规则本身的置信度以及找出的规律所增加的价值

量化”频繁“的手段
支持度:数据库中项集出现的次数。为了使支持度更有意义,设置最小支持阈值,即指定项集出现次数占数据总量的百分比,这个百分比要对问题领域有意义,超过这个阈值,即视为频繁项集。表示方法:

support(X->Y) = P(XuY)

置信度:这里置信度是一种有向关系,如”X导致Y的置信度为已知X的情况下Y的概率“记为:

confidence(X->Y) = P(Y|X) = support(XuY) / support(x)

关联规则:先导(确定项)->后继(结果项),如果左右点到,则需要重新计算关联规则。示例:

a -> b,c 
[支持度=1%,置信度=40%]

这条规则读作:数据库中有1%包含a,b,c的组合,在所有包含a的数据中,有40%

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值