利用kmeans或kshape聚类分析对归一化的无量纲时间-降雨序列进行聚类

最新推荐文章于 2024-05-12 10:27:05 发布

全栈若城

最新推荐文章于 2024-05-12 10:27:05 发布

阅读量1.2k

点赞数 1

文章标签：聚类 kmeans 机器学习

本文链接：https://blog.csdn.net/qq_33681891/article/details/131080088

版权

目标

利用kmeans或kshape聚类分析对归一化的无量纲时间-降雨序列进行聚类（分类，区分降雨雨型的差异）

聚类是一种常见的无监督学习方法，其任务是将一组相似的数据点分组为不同的簇(cluster)。
簇内的数据点应该彼此相似，而不同簇间的数据点应该差异较大。
聚类算法有许多种，常见的有 K-means、层次聚类、DBSCAN、GMM 等。

K-means 算法的原理是：首先随机选择 K 个初始质心，然后将数据点分配到最近的质心所在的簇中。然后重新计算每个簇的质心，将其作为新的质心。重复进行这些步骤，直到簇内变异程度最小或达到预定的迭代次数。

K-means 算法的参数包括：

K-shape 算法是一种基于 K-means 的时间序列聚类方法，其原理是利用 DTW 距离度量两个时间序列之间的相似度，然后使用 K-means 聚类算法将时间序列分配到不同的簇中。
K-shape 算法的参数设置与 K-means 稍有不同，主要有：

k：簇的数量，需要根据实际问题选择合适的值。
距离度量方法：使用 DTW 距离或其变体。
变换方法：可以使用 z-score、log-differencing、Piecewise Aggregate Approximation（PAA）等方法进行数据变换，以便更好地匹配时间序列之间的差异。

如果您已经安装了 Anaconda 发行版，则可以通过以下命令安装这些库：

conda install pandas numpy scikit-learn tslearn matplotlib

如果您没有安装 Anaconda，则可以通过以下命令使用 pip 安装这些库：

pip install pandas numpy scikit-learn tslearn matplotlib

import pandas as pd

关注