聚类

Shingle_

于 2018-08-23 01:03:01 发布

阅读量1.4k

点赞数 2

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Shingle_/article/details/81953576

版权

聚类既能作为一个单独过程，用于寻找数据内在的分布结构，也可作为分类等其他学习任务的前驱过程。

聚类算法涉及了2个基本问题——性能度量和距离计算（详见单独Blog）

维度灾难

在开始聚类前，先了解一个概念——维度灾难。

高维的欧式空间具有一些非直观的有时被称为“维度灾难”的性质。非欧式空间也往往具有同样的反常情况。“灾难”的一个表现时，在高维空间下，几乎所有的点对之间的聚类都差不多相等。另一个表现时，几乎任意的两个向量之间都是近似正交的。

性能度量

性能度量外部指标：

Jaccard系数（Jaccard Coeffient）
FM指数（Fowlkes and Mallows Index）
Rand指数（Rand Index）

性能度量外部指标：

DB指数（Davies-Bouldin Index）
Dunn指数（Dunn Index）

原型聚类

k均值算法（详见单独Blog）

k均值算法以k个随机质心开始。算法会计算每个点到质心的距离。每个点会被分配到距其最近的簇质心，然后紧接着基于新分配到的簇的点更新簇质心。以上过程重复数次至簇质心不变为止。

影响k-means效果的几个因素：初始簇质心、K值、距离度量

最低0.47元/天解锁文章

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
聚类

聚类既能作为一个单独过程，用于寻找数据内在的分布结构，也可作为分类等其他学习任务的前驱过程。聚类算法涉及了2个基本问题——性能度量和距离计算（详见单独Blog）维度灾难在开始聚类前，先了解一个概念——维度灾难。高维的欧式空间具有一些非直观的有时被称为“维度灾难”的性质。非欧式空间也往往具有同样的反常情况。“灾难”的一个表现时，在高维空间下，几乎所有的点对之间的聚类都差不多相等。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。