【论文详读】A Fast Adaptive k-means with No Bounds

最新推荐文章于 2022-03-29 19:15:47 发布

erdaidai

最新推荐文章于 2022-03-29 19:15:47 发布

阅读量926

点赞数 5

分类专栏：论文精读机器学习

本文链接：https://blog.csdn.net/erdaidai/article/details/108023901

版权

机器学习同时被 2 个专栏收录

12 篇文章 1 订阅

订阅专栏

论文精读

6 篇文章 0 订阅

订阅专栏

A Fast Adaptive k-means with No Bounds

算法目的
具体算法

算法目的

该算法是一种改进k-means聚类的算法，其减少了算法中距离计算的次数并提高了算法运行速度。

具体算法

k-means

分配步骤：设置K个初始中心点，把每个点分配到距离最近的中心点所在簇。
更新步骤：用簇中所有的点更新中心点，再把每个点分配到距离最近的中心点所在簇。直到更新前后的中心点差别不大时，整个算法结束。

ball k-means

具体实现

1）初始 k 个聚类中心，进行一次k-means聚类。
2）更新聚类中心，计算新旧中心点之间的距离 $\delta$ 。计算半径，生成球簇。
3）初始球簇中心距离矩阵，如果 $\operatorname{dist}\left(c_{i}^{(t)}, c_{j}^{(t)}\right)<2 r_{i}^{(t)}$ ，则认为 $c_{j}$ 所在簇是 $c_{i}$ 所在簇的近邻。
4）把有近邻的球簇分为两个区域，稳定区域（在下次迭代中不会移动）和活动区域（可能会被分到近邻球簇中）。把每个球簇的近邻根据距离进行从小到大的排序，稳定区域的边界由距离最近的近邻球簇中心之间的距离的一半为半径作圆形区域，其域内的点不变。活动区域形成环，每个环的边界由从小到大的近邻球簇的中心距离的一半作为半径围成圆确定，如下图所示。
在这里插入图片描述
5）稳定区域内点不变，第一层环内的点只能被分到本身或距离最近的近邻，依次计算距离，离谁中心近就分配给谁。第二层环内点，只能被分配到本身和距离第一近和次二近的近邻中，计算到各自的中心距离，谁近分配给谁，第 i 层环内点，只能分配给本身和前 i 近的近邻中。
6）更新中心点，重复第二步。
7）如果 $\operatorname{dtist}\left(c_{i}^{(t-1)}, c_{j}^{(t-1)}\right) \geq 2 r_{i}^{(t)}+\delta\left(c_{i}^{(t)}\right)+\delta\left(c_{j}^{(t)}\right)$
就不计算 $c_{i}$ 和 $c_{j}$ 新一轮的距离，直接赋值为 $\operatorname{dist}\left(c_{i}^{(t)}, c_{j}^{(t)}\right)=\operatorname{dist}\left(c_{i}^{(t-1)}, c_{j}^{(t-1)}\right)-\delta\left(c_{i}^{(t)}\right)-$ $\delta\left(c_{j}^{(t)}\right)$ 。否则就要计算两个中心点的距离。
8）重复4）~5）步，直到所有的簇都是稳定区域，无活动区域为止，算法结束。
在这里插入图片描述

算法优点

减少了计算距离次数，避免了每一次迭代都要计算每个点到中心点的距离。
减少了每次球簇中心点之间计算距离次数。上面第7）步体现。
原文链接：https://ieeexplore.ieee.org/document/9139397

erdaidai

关注

5
点赞
踩
16

收藏

觉得还不错? 一键收藏
3
评论
【论文详读】A Fast Adaptive k-means with No Bounds

A Fast Adaptive k-means with No Bounds算法目的具体算法k-meansball k-means相关概念具体实现算法目的该算法是一种改进k-means聚类的算法，其减少了算法中距离计算的次数并提高了算法运行速度。具体算法k-means分配步骤：设置K个初始中心点，把每个点分配到距离最近的中心点所在簇。更新步骤：用簇中所有的点更新中心点，再把每个点分配到距离最近的中心点所在簇。直到更新前后的中心点差别不大时，整个算法结束。ball k-means相关概念
复制链接

扫一扫