《高维数据的聚类分析研究及其应用》读书笔记

一、高维聚类の研究方向

        由于高维数据的稀疏性等特征,使得在高维聚类的研究中有如下几个研究重点:

1)维度约简,主要分为特征变换和特征选择两大类。前者是对特征空间的变换映射,常见的有PCA、SVD等。后者则是选择特征的子集,常见的搜索方式有自顶向下、随机搜索等;

2)高维聚类算法,主要分为高维全空间聚类和子空间聚类算法。前者的研究主要聚焦在对传统聚类算法的优化改进上,后者则可以看做维度约简的推广;

3)聚类有效性,是对量化评估方法的研究;

4)聚类结果表示方法;

5)高维数据索引结构;

6)高维离群点的研究...


二、该论文主要贡献

        该论文主要聚类于维度约简和聚类初始中心点选择两方面,前者作者提出了基于多层过滤的方法:先将特征重要度作为启发式信息来对遗传算法的初始群体进行优化,而后利用粗糙集的特性。对后者的研究,作者提出了一种基于点的局部密度的簇中心点初始化机制。同时,作者还提出了一种新的局部密度因子度量SNDF。


三、传统聚类方法

1.基于划分的方法

         即给定一个数据集,将其划分为k个子集,每个子集代表一个聚类。基于划分的聚类方法包括K-means、K-medoids、K-modes、CLARA等。

2.基于层次的聚类

        基于层次的聚类方法按照分裂或合并的原则,为数据集构造层次聚类树,根据终止条件得到聚类树某个层次上的聚类结果。根据树的构造方法可以分为如下两类:

  • 1
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值