基于scikit-learn实现k近邻算法（kNN）与超参数的调试

最新推荐文章于 2024-06-18 06:30:00 发布

江城的程序员大叔

最新推荐文章于 2024-06-18 06:30:00 发布

阅读量2.7k

点赞数 4

分类专栏：你好，机器学习文章标签： kNN sciket-learn 超参数 k近邻

本文链接：https://blog.csdn.net/sinat_33150417/article/details/83273922

版权

本文介绍了如何利用scikit-learn快速实现k近邻(kNN)算法，通过鸢尾花和手写数字识别数据集进行实例演示。同时探讨了kNN的超参数调试，包括选择最佳的k值、距离度量方式以及p参数，并提到了scikit-learn的网格搜索方法来优化超参数。

摘要由CSDN通过智能技术生成

前一篇关于kNN的博客介绍了算法的底层实现，这片博客让我们一起看一看基于scikit-learn如何快速的实现kNN算法。

scikit-learn内置了很多数据集，就不用我们自己编造假数据了，下面我们分别选用鸢尾花和手写数字识别的数据集。

首先导入需要的库

from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
import numpy as np

获取鸢尾花数据集

iris = datasets.load_iris()

iris_x = iris.data
iris_y = iris.target

使用train_test_split对训练集和测试集进行划分，这里随机种子传了666

x_train,x_test,y_train,y_test = train_test_split(iris_x, iris_y, test_size=0.2, random_state = 666)

接下来初始化kNN分类器，并且进行fit操作，由于kNN算法比较简单，fit操作只是把训练数据填进去，复杂一点的fit函数里对于数据有更多的处理。

最低0.47元/天解锁文章

江城的程序员大叔

关注

4
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
基于scikit-learn实现k近邻算法（kNN）与超参数的调试

前一篇关于kNN的博客介绍了算法的底层实现，这片博客让我们一起看一看基于scikit-learn如何快速的实现kNN算法。scikit-learn内置了很多数据集，就不用我们自己编造假数据了，下面我们分别选用鸢尾花和手写数字识别的数据集。首先导入需要的库from sklearn import datasetsfrom sklearn.neighbors import KNeighb...
复制链接

扫一扫

专栏目录