R——关联规则分析(一 理论)

一、简介

1、关联规则分析是数据挖掘中最活跃的研究方法之一

2、是揭示数据内在结构特征的重要手段(找出各项之间的关联关系,这种关系并没有在数据中直接表示出来)

3、分为:简单关联关系或序列关联关系

4、核心体现形式:关联规则(简单关联规则或序列关联规则)

二、简单关联关系

1、事务(简单关联关系的分析对象):由事务标识(TID)和项目集合X组成。

TID 项集X
1 ACD
2 BCE
3 ABCD
4 BE

(1)事务标识是确定事务的唯一标识

(2)项集是一组项目的集合,如上表为4项集

(3)项集的出现频率是所有包含项集的事务计数,又称作绝对支持度或支持度计数

2、简单关联规则: X→Y(S=s%,C=c%)

X成为规则的前项,Y成为规则的后项,S=s%表示规则支持度为s%, C=c%表示规则置信度为c%

(1)含义:由c%的把握程度相信有前项则有后项,该关联规则的使用性为s%,规则支持度和置信度是对关联规则的评价测度

(2)例面包→牛奶(S=85%C=90%)  

性别() ∩ 收入(>5000)→

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值