数据聚类建模之k-means

最新推荐文章于 2024-06-01 15:40:42 发布

JasonKQLin

最新推荐文章于 2024-06-01 15:40:42 发布

阅读量533

点赞数

分类专栏：统计机器学习文章标签：数据聚类建模 K-means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linkequa/article/details/88537276

版权

统计同时被 2 个专栏收录

35 篇文章 6 订阅

订阅专栏

16 篇文章 5 订阅

订阅专栏

1，数据聚类建模与数据预测建模的区别是它不区分输出变量和输入变量，希望将观测值分成两个及以上的自然小类。

2，K-means，顾名思义，根据“平均值”将数据聚成K类。

标准的K-means聚类步骤如下：
1，随机选k个点作为聚类中心；
2，剩下的每个点都与这k个点计算欧式距离，然后将该点划归于距离最小的那个类；
3，现在所有数据被分成了k类，计算每个类的图心（centroid），现在又获得新的k个点的位置；
4，重复2和3中的步骤，直到聚类中心不变（实际操作过程中是设置迭代次数，一般假设重复1000次后k个类基本不变了。这样得到的结果为局部最优解，不一定是全局最优解）。

Note: 关于图心，在几何学中叫质心（barycenter）。它指一个图形的算术平均中心。在三角形中就是三条中线的交点。

3，维基百科中的描述

在这里插入图片描述

4，此方法初始参数的设置

4.1 随机选取k个点作为聚类中心，也叫Forgy method。
适用于expectation maximization and standard k-means algorithms

4.2 将所有点随机分成k块，也叫Random Partition方法。
适用于k-harmonic means and fuzzy k-means

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据聚类建模之k-means

1，数据聚类建模与数据预测建模的区别是它不区分输出变量和输入变量，希望将观测值分成两个及以上的自然小类。K-means，顾名思义，根据“平均值”将数据聚成K类。...
复制链接

扫一扫

专栏目录

博客等级

码龄13年

205
原创

773
点赞

2488
收藏

272
粉丝

关注

私信

热门文章

分类专栏

deep learning 4篇
Machine learning in action学习笔记 1篇
photoshop 3篇
pycharm 1篇
高性能计算
LaTeX 2篇
科技论文 1篇
linux 11篇
python 31篇
perl 2篇
R 24篇
微积分 31篇
线性代数 21篇
统计 35篇
生物信息 19篇
Adobe illustrator 2篇
excel 2篇
git 3篇
机器学习 16篇
Anaconda 2篇
jupyter notebook 3篇
magic keywords 1篇
医疗AI 2篇
凸面和凹面 1篇
基础生物学 6篇
计算机基础 5篇
其它 3篇
word 4篇
endnote 3篇

最新评论

主轴定理（Principal axis theorem）
wai371447806: 博主， “两个向量的内积通常会对应到欧几里得平面的一个点” 你是不是手误打错了？
MAC word删除空白页与分节符
源棒棒: 将整个分节符选中，然后再按delete，有效。亲测有用，感谢
积分中值定理
梦星辰.: 拜读您的技术博客，真是一场思想的盛宴！您不仅深入浅出地剖析了复杂的技术概念，还巧妙地结合实践案例，让每一个细节都跃然纸上，易于消化。文章结构清晰，逻辑严谨，每一次翻阅都能收获满满的知识宝藏。尤为赞赏您对最新技术趋势的敏锐洞察与独到见解，着实启发思考。在这个信息爆炸的时代，您的博客如同一股清流，为技术探索者点亮了明灯，期待更多精彩的分享！
拉格朗日乘子
2301_80387922: 图用撒画的呀求🥺
支持向量机（SVM）前戏-手动求解超平面方程
歲歲年年啞: 贴贴佬

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。