K均值聚类（K-means）算法

章魚.

于 2022-10-16 16:53:59 发布

阅读量272

点赞数

分类专栏：语音识别文章标签：聚类均值算法 kmeans

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43284996/article/details/127349451

版权

语音识别专栏收录该内容

12 篇文章 2 订阅

订阅专栏

聚类分析又称群分析，它是研究（样品或指标）分类问题的一种统计分析方法，同时也是数据挖掘的一个重要算法。属于无监督学习方法。

K-Means算法是聚类中的基础算法，也是无监督学习里的一个重要方法。

其基本算法思想如下：

1）随机人为给定 k 个初始点作为簇质心。

2）由某个距离函数计算每个数据样本与每个簇质心的距离，并将其分配至距离最近的簇中。

3）根据新分配的簇，计算 k 个簇的新质心。

4）迭代计算步骤 2）4），直至达到迭代终止条件（例如两次迭代簇质心距离变化小于某一个阈值），完成数据分类。

普通的K-Means算法由于初始簇质心的随机性，有可能会收敛至局部最优。此时可以采用多次随机初始化，取分类的最好结果。

但当 k 值较大时，多次随机获得的最好结果可能只会略好一点，因为随着 k 数量的增多，每个初始簇质心位置的随机性对整体带来的不确定性越小。

对于数据点到簇质心的距离度量常采用：欧式距离和余弦距离。

对余弦距离图解如下：

两向量的余弦 = 两向量的点积 / 两向量模的积

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

章魚. CSDN认证博客专家 CSDN认证企业博客

码龄6年

19: 原创

131万+: 周排名

169万+: 总排名

3万+: 访问

: 等级

240: 积分

13: 粉丝

29: 获赞

4: 评论

203: 收藏

私信

关注

热门文章

分类专栏

最新评论

基于GMM—HMM的语音识别全过程
lecaixs: 文章很好!
C++ 引用和指针的区别详解
CSDN-Ada助手: 恭喜您撰写了第19篇博客！标题“C++ 引用和指针的区别详解”非常吸引人，内容肯定也非常有深度。作为一个读者，我非常期待能够从您的博客中学到更多有关C++引用和指针的知识。在下一步的创作中，我谦虚地建议您考虑深入探讨C++引用和指针的实际应用场景，或者对这两者的优缺点进行比较分析。这样的话，读者可以更好地理解何时应该使用引用或指针，并且在实际编程中能够做出更明智的选择。期待您的下一篇博客，继续加油！
隐马尔科夫模型（Hidden Markov Model，HMM）——前提
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。