K-Means和KNN

最新推荐文章于 2024-07-24 15:50:22 发布

Quinn-ntmy

最新推荐文章于 2024-07-24 15:50:22 发布

阅读量1.3k

点赞数

文章标签： kmeans 算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43421371/article/details/132774390

版权

主要区别

从无序 —> 有序
从K-Means —> KNN

KNN：监督学习，类别是已知的，对已知分类的数据进行训练和学习，找到不同类的特征，再对未分类的数据进行分类。
K-Means：无监督学习，事先不知道数据有几类，通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。

KNN

原理

将预测点与所有点的距离进行计算，然后保存并排序，选出前面K个值看看哪些类别比较多，则预测的点就属于哪一类。
KNN也可以用于回归预测

算法步骤

对未知类别属性的数据集中每个点依次执行以下操作：

计算已知类别数据集中的点与当前点之间的距离；
通常使用的是欧氏距离
按照距离递增次序排序；
选取与当前点距离最小的k个点；
如何确定k？
通过交叉验证，从选取一个较小的k值开始，不断增加k的值，然后计算验证集合的方差，最终找到一个比较合适的k值。
确定前k个点所在类别的出现频率；
返回前k个点出现频率最高的类别作为当前点的预测分类。

K-Means

原理

随机选取质心——计算各样本点和质心的距离后分类——再次选择新的质心
【扩展】
邻近度函数（即距离计算）：
（1）曼哈顿距离：质心——中位数，目标函数——最小化对象到簇质心的距离和；
（2）平方欧几里得距离：质心——均值，目标函数——最小化对象到簇质心的距离的平方和；
（3）余弦距离：质心——均值，目标函数——最大化对象与其质心的余弦相似度和；
（4）Bregman散度：质心——均值，目标函数——最小化对象到簇质心的Bregman散度和。

算法步骤

随机选取k个质心（k值取决于想聚成几类）；
计算样本到质心的距离，距离质心近的归为一类，分为k类；
求出分类后的每类的新质心；
再次计算样本到新质心的距离，距离质心距离近的归为一类；
判断新旧聚类是否相同，如果相同就代表已经聚类成功，如果没有则循环2-4。

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
K-Means和KNN

KNN：监督学习，类别是已知的，对已知分类的数据进行训练和学习，找到不同类的特征，再对未分类的数据进行分类。K-Means：无监督学习，事先不知道数据有几类，通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。
复制链接

扫一扫

Quinn-ntmy CSDN认证博客专家 CSDN认证企业博客

码龄6年

43: 原创

40万+: 周排名

27万+: 总排名

7万+: 访问

: 等级

460: 积分

25: 粉丝

21: 获赞

6: 评论

143: 收藏

私信

关注

热门文章

分类专栏

最新评论

Transformer回顾+理解
Quinn-ntmy: 不好意思，时间太久我不记得了，但是如果需要的话你可以找找自然语言处理领域的书籍(文本Embedding)都会有这部分的内容
Transformer回顾+理解
hjhigtrlk: 您好，请问你截的图是来自哪本书呢
K-Means和KNN
白话机器学习: 通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。
K-Means和KNN
白话机器学习: 写的非常详细，是一篇优质博客，干货满满，让我有了全新的认识，感谢博主分享，让我学到了很多，支持支持。
PyTorch的数据读取机制
Quinn-ntmy: 不好意思，现在才看到，你指的是如何利用tokenizer实现分词吗？现在基本使用Transformers的API来实现，也可以自己编写。上面的tokenizer.text_to_sequence就是将序列化后的文本转换成数字序列，通俗理解就是每个词都被映射为一个独有的数字。

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。