R 语言中的关联规则挖掘是一种无监督非线性算法,用于揭示项目如何相互关联。在其中,频繁挖掘显示了哪些项目一起出现在事务或关系中。它主要用于零售商、杂货店和拥有大型交易数据库的在线市场。当任何在线社交媒体、市场和电子商务网站使用推荐引擎知道您接下来要购买什么时,同样的方式。您在查看订单时获得的关于项目或变量的建议是因为关联规则挖掘基于过去的客户数据。衡量关联的常用方法有以下三种:
- Support
- Confidence
- Lift
在关联规则挖掘中,Support、Confidence 和 Lift 度量关联。
支持表示项目的受欢迎程度,以出现项目集的交易比例来衡量。
置信度表示购买商品 X 时购买商品 Y 的可能性有多大,表示为 {X -> Y}。
因此,它是通过与项目 X 的交易比例来衡量的,其中项目 Y 也出现。信心可能会歪曲联想的重要性。
Lift表示当商品 X 被购买时,商品 Y 被购买的可能性有多大,同时控制了商品