人工智能入门-R语言数据分析82

注意!

ß这里似乎有不严密的地方:即,A引申成了“尿布”,B引申成了“啤酒”,这样才能满足A Ç B =Æ,A È B才是指“尿布” 和“啤酒”这两样东西!

ß而且,命题之间的操作是“析取”、“合取”才对。

ß如果按前页所述,A、B是指“买了……的顾客”,则A、B 就是两个集合,但蕴含式要求前件、后件都是“命题”,反而不对了!

 

支持度、置信度与提升度

ß支持度用来删掉那些出现频度低的规则;是对关联规则重要性的衡量。

ß置信度是评价通过规则进行推理具有可靠性;对关联规则的准确程度的衡量。

ß提升度用来确保“前件”推出“后件”是有意义的;而不是因为“后件”普遍存在。

ß在关联规则挖掘中,满足一定最小置信度以及支持度的集合成为频繁集(或强关联)。

ß关联规则挖掘则是一个寻找频繁集的过程。 

 

 

提升度的意义

有1000名顾客,购买年货,A组有500人购买茶叶,有450人购买咖啡;B组有0人购买茶叶,有450人购买咖啡。

人工智能入门-R语言数据分析82
 

 

 

  

  茶叶->咖啡的支持度= 450/1000 = 45%

  茶叶->咖啡的置信度= 450/500 = 90%

  茶叶->咖啡的提升度= 90%/90%=1  

说明:由于lift(茶叶X->咖啡Y)=1,所以说明X与Y相互独立,即是否有X对于Y的出现没有影响。虽然支持度和置信度都高,但它们之间没有必然的关联关系

 

关联规则步骤

ß关联规则是从事务集合中挖掘出这样的关联规则{X->Y}:它的支持度和置信度要大于最小阈值,使用关联规则的过程主要包含以下三个步骤:

(1)数据筛选,首先对数据进行清洗,清洗掉那些普遍共有的项目

(2)根据支持度(support),从事务集合中找出频繁项集(使用算法:Apriori算法,FP-Growth算法) 

(3)根据置信度(confidence),从频繁项集中找出强关联规则(置信度阈值需要根据实验或者经验而定)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能大模型讲师培训咨询叶梓

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值