KMeans.java 代码解读与时间序列聚类

最新推荐文章于 2022-11-18 17:50:02 发布

云猫

最新推荐文章于 2022-11-18 17:50:02 发布

阅读量928

点赞数

分类专栏：机器学习与数据挖掘

本文链接：https://blog.csdn.net/yinghaijushi/article/details/74012441

版权

本文详细解读了KMeans算法的思想、步骤，包括如何选择初始类别中心，如何分配样本到最近的簇，以及如何更新簇中心。同时，介绍了KMeans算法在Java中的实现，并结合DTW（动态时间规整）方法用于时间序列聚类，讨论了如何使用DTW计算样本间的距离并更新簇中心。

摘要由CSDN通过智能技术生成

1.KMeans 算法思想：
对于给定的类别数目k,首先给出初始划分,通过迭代改变样本和簇的隶属关系,使得每一次改进之后的划分方案都较前一次好。

2.KMeans 算法步骤：

2.1. 选择初始的k个类别中心μ1,μ2 ...μk
2.2. 根据簇中心打标签阶段，即assignment。
对于每个样本x i ,将其标记为距离类别中心最近的类别,即:
label(i) = arg min|| Xi-μj||

2.3. 根据新做的标签的各个簇update簇中心阶段。即K-Means。
将每个类别中心更新为隶属该类别的所有样本的均值: μj = 1/Cj * sum(Xi)
2.4. 重复最后两步,直到类别中心的变化小于某阈值。
中止条件: 达到迭代次数或者簇中心变化率满足阈值

3.KMeans.java 算法代码如下：
/*numClusters 簇的数目，即聚类的数目K，K是预先指定的。
* niter 迭代计算的最大轮数
* centroids 各个簇中心的初始值，如果初始值是null，则会随机产生。
*/
public void clustering(int numClusters, int niter, double [][] centroids)
{
      _numClusters = numClusters;//簇的数目
      if (centroids !=null)
          _centroids = centroids;//簇中心
      else{
        // randomly selected centroids 随机产生

最低0.47元/天解锁文章

云猫

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
KMeans.java 代码解读与时间序列聚类

1.KMeans 算法思想：对于给定的类别数目k,首先给出初始划分,通过迭代改变样本和簇的隶属关系,使得每一次改进之后的划分方案都较前一次好。2.KMeans 算法步骤：2.1. 选择初始的k个类别中心μ1,μ2 ...μk2.2. 根据簇中心打标签阶段，即assignment。对于每个样本x i ,将其标记为距离类别中心最近的类别,即:label(i) = arg
复制链接

扫一扫

专栏目录