如何选择KNN的最合适的K值

最新推荐文章于 2024-08-13 11:32:36 发布

LuLiangJun001

最新推荐文章于 2024-08-13 11:32:36 发布

阅读量1.5w

点赞数 9

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/luliangjun001/article/details/105906741

版权

本文介绍了如何通过K折交叉验证选择KNN算法最合适的K值。强调了不应使用测试集进行模型验证，而应使用交叉验证来避免过拟合，详细阐述了K折交叉验证的工作流程，并提供了使用Python的sklearn库实现的示例。

摘要由CSDN通过智能技术生成

使用K折交叉验证评估最合适的K值

交叉验证是一个调参的过程，需要对提前给定的K值逐个去尝试，所以花费时间较长

交叉验证的第一步：把训练数据进一步分成训练集和验证集。

问：为什么不用测试集对模型进行验证和评估，而要拆分训练集呢？
答：测试数据是用来一次性测试的，一般用于项目上线时测试使用，而不能用于指导模型训练

工作流程：

现在开始使用K折交叉验证来挑选最合适的K值

导入相关库或模块

from sklearn import datasets
from sklearn.model_selection import KFold
from sklearn.neighbors import KNeighborsClassifier

导入iris数据集

iris = datasets.load_iris()
# X 为特征集，y 为标签集
X = iris['data']
y = iris['target']

然后开始写重要部分

# 这里定义6个候选值
fs =[1,

关注

专栏目录