- 非频繁模式是支持度<阈值的项集或规则
- 非频繁模式的应用:
- 利用数据中的负相关元素,有助于识别竞争项,找到某种商品的替代项
- 某些非频繁模式暗示了数据中出现了罕见的现象
- 挖掘非频繁模式的问题:
- 如何识别有用的非频繁模式
- 如何有效的在大型数据中发现它们
- 负模式:
- 负项集:有如下的性质:
- 负项集X=AU非B,其中A是正项的集合,非B是负项的集合,且至少有1个负项
- X的支持度>=minsup
- 负关联规则:有如下的性质:
- 规则时从负项集提取出来的
- 规则的支持度>=minsup
- 规则的置信度>=minconf
- 负项集和负关联统称为负模式
- 负项集:有如下的性质:
- 负相关模式:
- 负相关项集:s(AB)/s(A)*s(B)<1,则为负相关;如果项集的支持度<使用统计独立性假设计算出的其中各项的期望支持度,那么项集内的项是负相关的;s(X)越小,模式越负相关
- 负相关关联规则:s(XUY)<s(X)s(Y),其中X和Y是不相交的项集(关联规则本来前后件就是不相交的),那么关联规则X->Y是负相关的;但是X和Y中的项一般是正相关的,所以用部分条件(即上式)来定义负相关关联规则
- 负相关项集
第七章(3) 关联分析:非频繁模式
最新推荐文章于 2024-07-14 09:10:52 发布
非频繁模式是指支持度低于阈值的项集,它们在数据挖掘中有特定应用,如识别竞争项和揭示罕见现象。负模式包括负项集和负关联规则,具有特定的支持度和置信度要求。负相关模式则关注项集内的负相关性。文章探讨了挖掘负模式的挑战,提出了基于负模式和基于支持度期望的技术,并介绍了计算期望支持度的两种方法。有趣的是,非频繁模式的负相关模式可能是值得关注的研究焦点。
摘要由CSDN通过智能技术生成