《数据挖掘概念与技术》学习笔记第8章(8/10)聚类分析

《数据挖掘概念与技术》学习笔记第8(8/10)聚类分析

聚类分析

聚类分析是一种无指导的学习。对于聚类分析的好坏程度的判断标准是:可伸缩性、处理不同类型属性的能力、发现任意形状的聚类,用于决定输入参数的领域知识最小化、处理噪声数据的能力、对于数据记录的顺序不敏感、高维性、基于约束的聚类、可解释性和可用性。

 

数据矩阵

二模矩阵(tow-mode)

 

相异度矩阵

单模矩阵(one-mode)

 

数据标准化:

 

距离度量

欧几里德距离

曼哈坦距离

 

明考斯基距离

加权的欧几里得距离

 

二元变量的相异度

简单匹配系数

  

Jaccard系数

 

标称型变量的相异度

 

序数型变量的相异度

 

混合型变量的相异度

 

 

主要聚类方法

 划分方法

        k-平均,k-中心点
        EM,PAM,CLARA,CLARANS

层次方法

        凝聚型,分裂性: BIRCH,AGNES,DIANA,CURE,Chameleon

基于密度的方法

        DBSCAN,OPTICS,DENCLUE,

基于网格的方法

        STING,WaveCluster,Clique,

基于模型的聚类方法

        统计学方法(COBWEB),神经网络,

孤立点分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值