数据挖掘算法——关联关系挖掘(1)

数据挖掘算法——关联关系挖掘(1)

1、业务背景

大数据时代背景下,各行各业都有自己的数据,数据积累也越来越多,从海量的数据中,挖掘少量有效有价值的数据,是非常有必要的;如何挖掘数据的价值及数据之间存在的内在关系,是大家一直研究的问题
本篇介绍数据关联分析,关联分析可以应用于众多领域,如典型的购物车数据,通过用户的购物车分析出商品之间的关联关系,
{尿布} -> {啤酒}
当然,关联关系也可以应用于其他领域,医疗,科学数据,刑侦。。。。

2、基本概念

项: 一条记录
项集: 多个项组成的集合
序列:多个项集组成的有序集合
序列数据库: 由多个序列组成

关联规则:X -> Y , X 和 Y关联
支持度:
在这里插入图片描述
置信度:
在这里插入图片描述
频繁项集:满足最小支持的的项集

强规则:从频繁项集中提取的高置信度规则

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值