无监督K-Means算法（理论部分）

最新推荐文章于 2023-11-21 17:30:10 发布

JK Chen

最新推荐文章于 2023-11-21 17:30:10 发布

阅读量515

点赞数

分类专栏：机器学习 All

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jk_chen_acmer/article/details/103334497

版权

All 同时被 2 个专栏收录

629 篇文章 5 订阅

订阅专栏

25 篇文章 2 订阅

订阅专栏

代码部分：https://jkchen.blog.csdn.net/article/details/103338207

无监督学习

给出只有特征值的数据，自行分成多个相似的簇。

以下是两个特征值的可视化情况：
在这里插入图片描述
你需要做到的结果大致如下：

K-Means算法

流程：

先随机K个点，作为K个簇的中心；
然后对于每个样本点，寻找最近的中心，并加入那个簇；
每个簇的中心变为簇中的所有样本点的均值点；
重复这个过程直到不发生变化。

定义：

$x^{(i)}$ 为第i个样本点；
$\mu_k$ 为第k个簇的中心点；
$c^{(i)}$ 为第i个样本点的所属簇；
$J$ （畸变函数）为 $J(\mu,c)=\sum||x^{(i)}-\mu_{c^{(i)}}||^2$ ，即每个样本点到所属簇中心点的距离的平分和。

想法：

我们做第二步（寻找每个样本点的簇）是为了通过改变 $c^{(i)}$ 来减小 $J$ ；
做第三步（寻找每个簇的中心）是为了通过改变 $\mu_{k}$ 来减小 $J$ ；
两种分类方法的优劣可以通过 $J$ 的大小进行比较。

优化（重点）：

随机空间上的点过于随机，我们可以用随机样本点来代替；
初始值的选择很大程度上影响最后的结果，可能导致局部最优解，所以我们可以多做几次；
多做几次只有当K较小（小于10）时作用较大。

K的选择

很大程度上由主观决定。

虽然很多时候不能做到可视化，但是可以根据实际需求决定。例如为了做衣服，按照用户的身高体重，将用户分为三类，对应衣服的 $S, M, L$ 。

如果不能确定，可以使用“肘部法则”（不能指望。。。）：

在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JK Chen CSDN认证博客专家 CSDN认证企业博客

码龄7年

979: 原创

2万+: 周排名

7680: 总排名

111万+: 访问

: 等级

1万+: 积分

629: 粉丝

1015: 获赞

316: 评论

2761: 收藏

私信

关注

热门文章

分类专栏

最新评论

Unreal FFastArray 实现原理
JK Chen: 前后类型不一致？
Unreal FFastArray 实现原理
m0_73543190: 我使用FFastArraySerializer::FastArrayDeltaSerialize为什么会报这个错呢 10>FastArraySerializer.h(710): Error C2338 : static_assert failed: 'Auto deduced FastArrayItemType is invalid or differs from the specified type. Make sure that the FastArraySerializer has a single replicated array property.'
Triangle Collision（二分平面几何）
吃猪的狗: 太聪明了，我想半天没想出来咋写，佩服
Unreal 寻路系统介绍
JK Chen: NavSystem和NavData应该有个是否在client生成寻路数据的选项，你这个在客户端发起的寻路，应该是客户端本地没有寻路数据导致的
Unreal 寻路系统介绍
AYAYA#2887: 多人联机下客户端无法进行路径查找；通过debug发现是客户端在执行到GetNavDataForProps()方法时返回为null失败（文章中“Agent的挑选”栏目下的第一段代码）请问这个联机下寻路bug有什么思路么

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。