【机器学习十大算法】--K-Means/DBSCAN聚类算法（通俗易懂保姆级讲解）

最新推荐文章于 2024-09-07 18:59:08 发布

Python很六

最新推荐文章于 2024-09-07 18:59:08 发布

阅读量227

点赞数

文章标签：机器学习算法 kmeans 人工智能聚类深度学习线性回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A16670113506/article/details/132556820

版权

机器学习中，已经分析过属于回归任务的线性回归模型，以及属于分类任务的逻辑回归模型，两者都属于有监督模型，即数据集必须包含真实值，也就是标签。如果我们的数据集没有确切的标签，这种情况下归类于无监督问题，本篇讲解机器学习中简单好用的两类无监督聚类算法。配套

【课件+代码】资料和人工智能学习大礼包，关注V X信公众号【迪哥谈AI】回复888 分

聚类任务的本质就是分类，将相似的东西划归为同一类。由于数据集中没有标签，因此无监督聚类任务的难点在于很难直接评估模型的效果，模型调参也没有清晰的依据，K-means算法是机器学习中经典的聚类算法

K-means 算法的基本思想是将所有的数据划分为 K 个簇，K 的数值是人为设定的，簇中心的定义是质心，即该簇中所有的向量在各个维度上计算得到的平均值。 数据集中每个点计算与簇中心的欧几里得距离或者余弦相似度，并将其作为入簇

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【机器学习十大算法】--K-Means/DBSCAN聚类算法（通俗易懂保姆级讲解）

K-means 算法的实现过程如下图所示，首先随机初始化 K 个点作为簇中心（图 b），计算数据集中所有点到 K 个簇中心的欧氏距离，并根据就近原则将其划分入簇（图 c），根据各簇中的数据重新计算簇中心的位置（图 d），再次重复上述步骤：计算欧式距离、分簇、更新簇中心等过程，直至各簇趋于稳定。（3）对于该点邻域内的其他点，将其添加至 N 集合中，并依次重复上述过程，循环标记、判断这些点是否为核心点，若为核心点则加入簇 C 中，邻域内的点加入集合 N 中。若某个点的密度超过算法设定的阈值，则其为核心点。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。