【机器学习】k_means和KNN

最新推荐文章于 2022-09-20 15:50:00 发布

1273545169

最新推荐文章于 2022-09-20 15:50:00 发布

阅读量197

点赞数

本文链接：https://blog.csdn.net/baidu_27643275/article/details/81987155

版权

https://www.cnblogs.com/pinard/p/6164214.html

这里写图片描述
（摘自参考链接1）

k_means算法：

（1）随机选择K个点作为每个类的初始质心；
（2）在数据集中选择一个样本，计算其与每个类质心的距离，然后将该样本归到距离最短的那个中心所在的类。重复此操作，直到所有样本全部归好类；
（3）计算各个类的均值，以均值来作为各个类的质心；
（4）重复（2）（3）步，直到某次的质心（均值）与上一次迭代的质心重合为止。

python实现：

python sklearn：

from sklearn import datasets
from sklearn.cluster import KMeans

iris = datasets.load_iris()
print(dir(iris))
print(iris.target)

model = KMeans(n_clusters=3)
model.fit(iris.data)
all_preditions = model.predict(iris.data)
print(all_preditions)
#效果好差啊

KNN算法：

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。

在这里插入图片描述

（1）计算测试数据与各个训练数据之间的距离；

（2）按照距离的递增关系进行排序；

（3）选取距离最小的K个点；

（4）确定这K个点所在类别的出现频率；

（5）返回前K个点中出现频率最高的类别作为测试数据的预测分类。

python实现：

参考：
KNN算法理解与实现
 机器学习之深入理解K-means、与KNN算法区别及其代码实现

1273545169

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】k_means和KNN

k_means算法流程：（1）随机选择K个点作为每个类的初始质心；（2）在数据集中选择一个样本，计算其与每个类质心的距离，然后将该样本归到距离最短的那个中心所在的类。重复此操作，直到所有样本全部归好类；（3）利用均值等方法更新各个类的质心；（4）重复（2）（3）步，直到某次的质心与上一次迭代的质心重合为止。python实现：python ...
复制链接

扫一扫