购物篮分析分类算法——频繁模式挖掘(聚类算法)

本文介绍了购物篮分析中的频繁模式挖掘,包括频繁项集的概念及其在商务决策中的应用。关联规则的支持度和置信度被用来衡量项集之间的关联强度。Apriori算法作为一种挖掘频繁项集的方法,利用先验性质压缩搜索空间。此外,文章还讨论了模式评估方法,如提升度,用于评估关联规则的相关性。
摘要由CSDN通过智能技术生成

        频繁模式是频繁地出现在数据集中的模式,包括频繁项集(如牛奶和面包)、频繁子序列(首先购买PC,然后是数码相机,再后是内存卡)或频繁子结构(涉及不同的结构形式,如子图、子树或子格,它可能与项集或子序列结合在一起)。从大量的商务事物记录中发现有趣相关联系,可为分类设计、交叉销售和购物购买习惯分析等许多商务决策过程提供帮助。

频繁项集挖掘,如购物篮分析等,这些模式可用关联规则的形式表示。

 

       关联规则的支持度为2%,意味所分析的所有事务的2%显示计算机和杀毒软件被同时购买。置信度60%意味购买计算机的顾客60%也购买了杀毒软件。

      项的集合称为项集。包含k个项的项集称为k项集。项集的出现频度是包含项集的事务数,称为项集的频度、支持度计数或计数。

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值