2021-04-13频繁模式挖掘

Mining Multiple-Level Associations

在这里插入图片描述
1.第一层5% min_sup 阈值
第二层应该降低
在这里插入图片描述


2.如果第二层数据的规则和第一层(祖先层)类似,则第二层是多余的

在这里插入图片描述


3.用统一的min_support阈值对所有商品是不合理的,因为有一些高价商品购买量很小,所以应该分类来设定min_support阈值

多维度关联
在这里插入图片描述
类别属性或者数值型属性


发现异常现象发现异常现象,如女性且南方的平均工资为6.3/hr


在这里插入图片描述
稀有模式,如买劳力士表
相反模式,如买了烧油汽车的人很可能不会买混合动力汽车


在这里插入图片描述
如何定义负相关的模式,用支持度为基础的定义-非0不变,有Null transactions的问题
也就是分母的问题,因为是按百分比的。


在这里插入图片描述
以kulc度量为基础的定义,去除了分母的影响

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值