统计学习方法02-14.3 k-means聚类

最新推荐文章于 2024-05-15 14:21:36 发布

sanctuary03

最新推荐文章于 2024-05-15 14:21:36 发布

阅读量590

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sanctuary03/article/details/114710714

版权

本博客主要用于本人重新复习知识点，所有参考列在文尾。如有错误，希望一起交流。

目录

基础知识
算法特点
Python 实现
- 伪代码
Sklearn
扩展
参考

基础知识

k-means 聚类是基于样本集合划分的聚类算法。属于硬聚类。

具体：将样本集合划分为k个子集，构成k个类，每个样本到其所属的类中心的距离最小。
k个聚类特点：各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。
k-means算法的基础：最小误差平方和准则
迭代算法，不能保证得到全局最优

1. 模型

k-means 聚类的目标：将n个样本分到k个不同的类或者簇中，假设 $k < n$ .
k-means 聚类的模型是一个从样本到类的函数： $l = C (i)$ ，其中 $i$ 表示每一个样本(共n个)， $l$ 表示每一个类别(共k个)。

2. 策略

k-means 聚类的策略：通过损失函数的最小化选取最优的划分或函数 $C^*$ .
样本之间的距离定义为欧氏距离平方： $d(x_i,x_j)=\sum \limits_{k=1}^m(x_{ki}-s_{kj})^2=||x_i-x_j||^2$

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
统计学习方法02-14.3 k-means聚类

k-means 聚类是基于样本集合划分的聚类算法。属于硬聚类。具体：将样本集合划分为k个子集，构成k个类，每个样本到其所属的类中心的距离最小。模型k-means 聚类的目标：将n个样本分到k个不同的类或者簇中，假设k<nk<nk<n.k-means 聚类的模型是一个从样本到类的函数：l=C(i)l=C(i)l=C(i)，其中 iii 表示每一个样本(共n个)，lll 表示每一个类别(共k个)。策略k-means 聚类的策略：通过损失函数的最小化选取最优的划分或函数 C∗
复制链接

扫一扫

专栏目录

sanctuary03 CSDN认证博客专家 CSDN认证企业博客

码龄5年

9: 原创

13万+: 周排名

36万+: 总排名

8496: 访问

: 等级

153: 积分

67: 粉丝

3: 获赞

5: 评论

15: 收藏

私信

关注

热门文章

分类专栏

最新评论

统计学习方法04-16 PCA
不正经的kimol君: 忍不住就是一个赞，写得很棒，欢迎回赞哦~
统计学习方法02-14.3 k-means聚类
不正经的kimol君: 在最美的年华，做最好的自己，加油！
MNIST 数据集标签图片读取
ctotalk: thanks very good
pytorch艰难安装路
sanctuary03 回复 Mr灬NN: 遇到这问题还哭笑不得
pytorch艰难安装路
Mr灬NN: 我装了一下午才发现pytorch没有64的包，上网搜一下发现果然有人和我一样用的32位的python 哭了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。