时间序列聚类K-means算法

最新推荐文章于 2024-05-12 10:27:05 发布

jack_jay_du

最新推荐文章于 2024-05-12 10:27:05 发布

阅读量8.6k

点赞数 1

分类专栏： 2019年7月文章标签： k-means 时间序列聚类 python k-mean k-mean聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jack_jay_du/article/details/97376249

版权

2019年7月专栏收录该内容

3 篇文章 0 订阅

订阅专栏

K-means算法定义

k-平均算法（英文：k-means clustering）源于信号处理中的一种向量量化方法，现在则更多地作为一种聚类分析方法流行于数据挖掘领域。k-平均聚类的目的是：把n个点（可以是样本的一次观察或一个实例）划分到k个聚类中，使得每个点都属于离他最近的均值（此即聚类中心）对应的聚类，以之作为聚类的标准。这个问题将归结为一个把数据空间划分为Voronoi cells的问题。

算法描述

已知观测集{x1,x2,...xn}，其中每个观测都是一个d-维实向量，k-平均聚类要把这n个观测划分到k个集合中(k≤n),使得组内平方和最小。公式可以表示为：

其中 $\mu$ i为均值。

算法执行

1、初始化

从观测值中随机选取k个质心。通常使用的初始化方法有Forgy和随机划分(Random Partition)方法。

Forgy方法随机地从数据集中选择k个观测作为初始的均值点；而随机划分方法则随机地为每一观测指定聚类，然后运行“更新(Update)”步骤,即计算随机分配的各聚类的图心，作为初始的均值点

2、分配

将每个观测分配到聚类中，使得组内平方和（WCSS）达到最小。

每一个观测值分配到其中的一个聚类中。

3、更新

对于上一步得到的每一个聚类，以聚类中观测值的图心，作为新的均值点。

算术平均是最小二乘估计，所以这一步同样减小了目标函数组内平方和（WCSS）的值。

把“分配”步骤视为“期望”步骤，把“更新”步骤视为“最大化步骤”，可以看到，这一算法实际上是广义期望-最大化算法（GEM）的一个变体。

参考连接

https://zh.wikipedia.org/wiki/K-%E5%B9%B3%E5%9D%87%E7%AE%97%E6%B3%95

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
打赏
1
评论
时间序列聚类K-means算法

K-means算法定义k-平均算法（英文：k-means clustering）源于信号处理中的一种向量量化方法，现在则更多地作为一种聚类分析方法流行于数据挖掘领域。k-平均聚类的目的是：把n个点（可以是样本的一次观察或一个实例）划分到k个聚类中，使得每个点都属于离他最近的均值（此即聚类中心）对应的聚类，以之作为聚类的标准。这个问题将归结为一个把数据空间划分为Voronoi cells的问题。...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

jack_jay_du 你的鼓励是我的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。