机器学习— 聚类（2）K-means聚类

最新推荐文章于 2024-07-12 17:26:09 发布

闷骚的小蝎子

最新推荐文章于 2024-07-12 17:26:09 发布

阅读量318

点赞数 1

分类专栏：机器学习 # 无监督学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45088472/article/details/109542255

版权

本文详细介绍了K-means聚类算法，包括模型、策略和算法步骤。K-means是一种基于样本集合划分的聚类算法，通过最小化样本到类中心的距离总和来寻找最优划分。算法采用迭代方式，每次迭代包括样本分配和类中心更新，直至聚类结果稳定。

摘要由CSDN通过智能技术生成

1. $k$ 均值聚类

$k$ 均值聚类是基于样本集合划分的聚类算法。 $k$ 均值聚类将样本集合划分为 $k$ 个子集，构成 $k$ 个类, 将 $n$ 个样本分到 $k$ 个类中，每个样本到其所属类的中心的距离最小。每个样本只能属于一个类, 所以 $k$ 均值聚类是硬聚类。下面分别介绍 $k$ 均值聚类的模型、策略、算法, 讨论算法的特性及相关问题。

1.1 模型

给定 $n$ 个样本的集合 $X=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\},$ 每个样本由一个特征向量表示, 特征向量的维数是 $m_{0} k$ 均值聚类的目标是将 $n$ 个样本分到 $k$ 个不同的类或族中，这里假设 $k<n_{\circ} k$ 个类 $G_{1}, G_{2}, \cdots, G_{k}$ 形成对样本集合 $X$ 的划分，其中 $G_{i} \cap G_{j}=\varnothing, \bigcup_{i=1}^{k} G_{i}=X_{\circ}$ 用 $C$ 表示划分, 一个划分对应着一个聚类结果。
划分 $C$ 是一个多对一的函数。事实上，如果把每个样本用一个整数 $\in$ $\{1,2, \cdots, n\}$ 表示，每个类也用一个整数 $\in\{1,2, \cdots, k\}$ 表示，那么划分或者聚类可以用函数 $l = C (i)$ 表示, 其中 $\in\{1,2, \cdots, n\}, l \in\{1,2, \cdots, k\}$

最低0.47元/天解锁文章

闷骚的小蝎子

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

闷骚的小蝎子 CSDN认证博客专家 CSDN认证企业博客

码龄5年

11: 原创

78万+: 周排名

145万+: 总排名

1万+: 访问

: 等级

240: 积分

4: 粉丝

19: 获赞

9: 评论

49: 收藏

私信

关注

热门文章

分类专栏

最新评论

机器学习— 聚类（2）K-means聚类
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客对于想要学习机器学习中聚类算法的读者们非常有用。我觉得接下来可以写一篇关于“DBSCAN聚类算法在图像处理中的应用”，这样的技术文章对于想要深入了解聚类算法在图像处理中应用的读者们非常有帮助。下一篇博客继续写，相信会有更多读者受益。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
监督学习之感知机
zyping1989: 谢谢哦！一起学习，一起进步！
监督学习之感知机
闷骚的小蝎子: ............这个我也不太会，自从学py就是做数据分析了
监督学习之感知机
zyping1989: 一起学习呀，我也是刚开始学习！请问您知道二叉搜索该如何建立吗？我下面的代码，一直提示：TypeError:BST() takes no arguments.[code=python]class BiTreeNode: def __init__(self, data): self.data = data self.lchild = None self.rchild = None self.parent = None class BST: def __int__(self, li = None): self.root = None if li: for var in li: self.insert_no_rec(var) def insert_no_rec(self, val): p = self.root if not p: # 空树特殊处理 self.root = BiTreeNode(val) return while True: if val < p.data: if p.lchild: p = p.lchild else: # 左孩子不存在 p.lchild = BiTreeNode(val) p.lchild.parent = p return elif val > p.data: if p.rchild: p = p.rchild else: # 右孩子不存在 p.rchild = BiTreeNode(val) [/code]
监督学习之感知机
闷骚的小蝎子: 我也是初学者我觉得应该看输出向量的维度如果标签y是多维表示的则b对应的应该是y的维度，因为我这的标签是一维的，所以我输出的b写的直接是一维的，没有按照面向对象的思想写。谢谢指正

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。