关联分析和聚类

http://c.biancheng.net/view/3703.html
关联规则

支持度

一般要求一定支持度以上,才有分析价值,一般最小支持度不易太低,
规则一:支持度大于xx
一般地,只需关心那些不被其他频繁项集所包含的所谓最大频繁项集的集合。发现所有的频繁项集是形成关联规则的基础。
例外情况,稀有模式挖掘eg:爱马仕和劳力士

置信度

规则二:置信度
(一般分析强关联,保留高置信度)
在这里插入图片描述

支持度:几个关联的数据在数据集中出现的次数占总数据集的比重
在这里插入图片描述
置信度:一个数据出现后,另一个数据出现的概率,或者说数据的条件概率。
在这里插入图片描述
提升度:表示含有Y的条件下,同时含有X的概率,与X总体发生的概率之比
在这里插入图片描述

Apriori算法(仅适用于一维)

Apriori算法分两步进行,第一步生成所有频繁项目集,第二步从频繁项目集中生成所有可信关联规则。

聚类

(重点在于聚类后的分析)

K-means聚类

https://blog.csdn.net/u011511601/article/details/81951939
注意属性的选择,可以区分样本之间的特征
1.先随机选择一个聚类中心,
2.剩余的各自聚类(聚类的类数k应实现给出),每个数据点通过计算点和每个组中心之间的距离进行分类,然后将这个点分类为最接近它的组。
3.给每一类取均值(按属性值取平均),
4.若与初始新选择的聚类中心不同,则将所得均值作为新的聚类中心,进行二次分类
5.数值均值易受到极端值影响,因此需要事先进行标准化

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值