第七章(3) 关联分析:非频繁模式

非频繁模式是指支持度低于阈值的项集,它们在数据挖掘中有特定应用,如识别竞争项和揭示罕见现象。负模式包括负项集和负关联规则,具有特定的支持度和置信度要求。负相关模式则关注项集内的负相关性。文章探讨了挖掘负模式的挑战,提出了基于负模式和基于支持度期望的技术,并介绍了计算期望支持度的两种方法。有趣的是,非频繁模式的负相关模式可能是值得关注的研究焦点。
摘要由CSDN通过智能技术生成
  1. 非频繁模式是支持度<阈值的项集或规则
  2. 非频繁模式的应用:
    1. 利用数据中的负相关元素,有助于识别竞争项,找到某种商品的替代项
    2. 某些非频繁模式暗示了数据中出现了罕见的现象
  3. 挖掘非频繁模式的问题:
    1. 如何识别有用的非频繁模式
    2. 如何有效的在大型数据中发现它们
  4. 负模式:
    1. 负项集:有如下的性质:
      1. 负项集X=AU非B,其中A是正项的集合,非B是负项的集合,且至少有1个负项
      2. X的支持度>=minsup
    2. 负关联规则:有如下的性质:
      1. 规则时从负项集提取出来的
      2. 规则的支持度>=minsup
      3. 规则的置信度>=minconf
    3. 负项集和负关联统称为负模式
  5. 负相关模式:
    1. 负相关项集:s(AB)/s(A)*s(B)<1,则为负相关;如果项集的支持度<使用统计独立性假设计算出的其中各项的期望支持度,那么项集内的项是负相关的;s(X)越小,模式越负相关
    2. 负相关关联规则:s(XUY)<s(X)s(Y),其中X和Y是不相交的项集(关联规则本来前后件就是不相交的),那么关联规则X->Y是负相关的;但是X和Y中的项一般是正相关的,所以用部分条件(即上式)来定义负相关关联规则
    3. 负相关项集
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值