关联规则挖掘(一)

关联规则挖掘是数据挖掘的一种手段,常用于购物篮分析,如啤酒与尿布的故事。它旨在发现大量数据中项集间的关联,帮助制定营销策略。挖掘过程包括找频繁项集和生成强规则,支持度和置信度是评估规则的重要指标。关联规则可按值类型、数据维、抽象层和扩充形式分类。
摘要由CSDN通过智能技术生成

关联规则挖掘是一种常用的数据挖掘手段,本文作为关联规则挖掘的第一篇文章,将主要介绍关联规则挖掘的来历与目的,以购物篮分析的一个简单例子熟悉基本概念,以及从多维度对关联规则挖掘进行分类

一、概述

相信大家都听过啤酒与尿布的故事,这就是一个最典型的关联规则挖掘的例子:购物篮分析。通过发现顾客放入其购物篮中不同商品之间的联系,分析顾客的购买习惯,进而了解哪些商品频繁地被顾客同时购买,这种关联规则的发现可以帮助零售商制定营销策略。例如,在同一次去超市,如果顾客购买牛奶,他也购买面包的可能性有多大?通过帮助零售商有选择地经销和安排货架,这种信息可以引导销售。例如,将牛奶和面包尽可能放近一些,可以进一步刺激一次去商店同时购买这些商品;亦或者将牛奶和鸡蛋放在商店的两端,可能诱发买这些商品的顾客一路挑选其它商品。
关联规则挖掘的目的是发现大量数据中项集之间有趣的关联或相关联系。随着大量数据不停地收集和存储,许多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。从大量商务事务记录中发现有趣的关联关系,可以帮助许多商务决策的制定,如分类设计、交叉购物和贱卖分析

二、基本概念

以一个简单的例子来理解基本概念:

t1: 牛肉、鸡肉、牛奶
t2: 牛肉、奶酪
t3: 奶酪、靴子
t4: 牛肉、鸡肉、奶酪
t5: 牛肉、鸡肉、衣服、奶酪、牛奶
t6: 鸡肉、衣服、牛奶
t7: 鸡肉、牛奶、衣服

I={ i1,i2,...,im} 是项的集合,即 I={ }
任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合,使得 TI ,即 D={ t1,t2,t3

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值