Day 57：聚类，k-means方法

最新推荐文章于 2022-07-20 16:46:11 发布

Garciaxx

最新推荐文章于 2022-07-20 16:46:11 发布

阅读量160

点赞数

分类专栏：学习记录学习成长学习笔记文章标签：聚类算法 python 机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50192514/article/details/119156020

版权

Python 回忆录

2021/07/27

2021/07/27

非监督学习

现在有一些数据，只有特征值没有目标值，我们对这些数据进行分类。非监督学习，对相似样本进行分类，使有相似特征的样本分在同一类里（同一个目标值）。简单来想，分成几个类就是目标值有几种。

聚类方法

k：分成多少类，是一个超参数。
一般来说都会知道，要分成多少类，暂时不考虑会分为多少类
在这里插入图片描述
上图给出了一些样本，确定了k为3. 需要把这些样本分成3类。

第一步：随机从样本中取3个点，当做3个类别的中心点（k1,k2,k3）
第二步：计算样本其余点到3个中心点的距离（a,b,c）。距离哪个中心点最近，那个点就是哪个类别。分成3个族群
第三步：分别计算这三个族群的平均值，把3个族群的平均值与旧中心点（k1,k2,k3）比较
第四步：如果族群平均值和旧中心点相同，结束聚类；如果不同，就把族群平均值换为新的类别中心点，继续重复第二步到第四步

k-means API

sklearn.cluster.KMeans(n_cluster=8,init='kmeans++')n_cluster:开始聚类中心数量，init：初始化方法

from sklearn.cluster import KMeans
import matplotlib.pyplot

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Day 57：聚类，k-means方法

Python 回忆录2021/07/27非监督学习2021/07/27非监督学习现在有一些数据，只有特征值没有目标值，我们对这些数据进行分类。就是非监督学习，只有对相似样本进行分类，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。