c均值聚类中心坐标公式如何使用_K-means 聚类方法笔记

最新推荐文章于 2022-05-15 16:35:59 发布

VIP文章请看我简介

最新推荐文章于 2022-05-15 16:35:59 发布

阅读量1.2k

点赞数 1

文章标签： c均值聚类中心坐标公式如何使用

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34614567/article/details/113579242

版权

K-means聚类方法简单来说是将相似的物体分为一类。

K-means聚类方法属于无监督学习。在无监督学习中，物体没有标签（lable）。

那么如何评估物体的相似度？

可使用不同物体之间的距离来量化表示物体的相似度。距离越小，表明物体越接近，距离越小，表明物体越不相似。

最常用的距离是欧式距离，计算公式如下：

x和y之间的距离

但是因为数据有不同的类型，数值型、类别型、排序型等。数值型数据可以直接使用欧式距离公式计算距离。类别型和排序型数据则需要使用一些方法处理后，才可以计算。

数值型变量可直接使用欧氏距离公式计算两点间的距离。计算前可先对数据进行归一化或离散化处理，避免不同变量量纲存在较大区别或其他的问题。

类别型变量可使用独热编码的方式进行处理。

排序性变量有两种方式处理。一是直接使用排序的数值，二是转为独热编码。

知道了如何评估物体间的相似度，下面就要学习K-means算法的核心了。

K-means算法

最低0.47元/天解锁文章

请看我简介

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
c均值聚类中心坐标公式如何使用_K-means 聚类方法笔记

K-means聚类方法简单来说是将相似的物体分为一类。K-means聚类方法属于无监督学习。在无监督学习中，物体没有标签（lable）。那么如何评估物体的相似度？可使用不同物体之间的距离来量化表示物体的相似度。距离越小，表明物体越接近，距离越小，表明物体越不相似。最常用的距离是欧式距离，计算公式如下：x和y之间的距离但是因为数据有不同的类型，数值型、类别型、排序型等。数值型数据可以直接使用欧式距离...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。