【Python机器学习】构建简单的k近邻算法模型

最新推荐文章于 2024-08-19 13:32:52 发布

zhangbin_237

最新推荐文章于 2024-08-19 13:32:52 发布

阅读量715

点赞数 24

分类专栏： Python机器学习文章标签： python 机器学习近邻算法

本文链接：https://blog.csdn.net/weixin_39407597/article/details/135369950

版权

Python机器学习专栏收录该内容

168 篇文章 1 订阅

订阅专栏

k近邻算法是一个很容易理解的算法，构建模型只需要保存训练数据集。要对一个新的数据点做出预测，算法会在训练集中寻找与这个新数据点距离最近的数据点，然后将找到的数据点的标签赋值给这个新数据点。

l近邻算法中k的含义是：我们可以考虑训练集中与新数据点最近的任意k个邻居，而不是只考虑最近的一个。

scikit-learn中算有的机器学习模型都在各自的类中实现，被称为Estimator类。k近邻算法就是在neighbors模块中的KNeighborsClassifier类，使用它需要设置模型的参数，KNeighborsClassifier最重要的参数就是邻居的数据，先设置1看下结果。

import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

iris_dataset=load_iris()
X_train,X_test,y_train,y_test=train_test_split(
    iris_dataset['data'],iris_dataset['target'],random_state=0
)

knn=KNeighborsClassifier(n_neighbors=1)
knn.fit(X_train,y_train)
KNeighborsClassifier(algorithm='auto',leaf_size=30,metric='minkowski',metric_params=None,n_jobs=1,n_neighbors=1,p=2,weights='uniform')

X_new=np.array([[5,2.9,1,0.2]])
print('X_new:{}'.format(X_new.shape))

prediction=knn.predict(X_new)
print('prediction:{}'.format(prediction))
print('prediction 种类:{}'.format(iris_dataset['target_names'][prediction]))

输出：

根据输出结果可以看到，模型根据输入的结果判断，类别为0，也就是‘setosa’品种

zhangbin_237

关注

24
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
【Python机器学习】构建简单的k近邻算法模型

k近邻算法是一个很容易理解的算法，构建模型只需要保存训练数据集。要对一个新的数据点做出预测，算法会在训练集中寻找与这个新数据点距离最近的数据点，然后将找到的数据点的标签赋值给这个新数据点。
复制链接

扫一扫

专栏目录