关联规则算法

关联规则是无监督的学习方法,可以帮助商务决策的制定,如分类设计、交叉购物等。

定义:

        设I={i1,i2…,im}为所有项目的集合,设A是一个由项目构成的集合,称为项集。事务T包含项集A,当且仅当AT。如果项集A中包含k个项目,则称其为k项集。D为事务数据库,项集A在事务数据库D中出现的次数占D中总事务的百分比叫做项集的支持度(support)。如果项集的支持度超过用户给定的最小支持度阈值,就称该项集是频繁项集(或大项集)。

关联规则就是形如X→Y的逻辑蕴含关系,其中 X @ I ,Y @ I 且X∩Y=Φ,如果事务数据库有s%的事务包含X∪Y,(X称作规则的前件,Y是结果)对于关联规则X→Y,存在支持度和信任度。(@为数学符号子集)
 
支持度:指规则中所出现
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值