用K折交叉验证估计KNN算法中的K值

最新推荐文章于 2025-02-19 16:56:19 发布

氟西汀汀汀不喝奶茶

最新推荐文章于 2025-02-19 16:56:19 发布

阅读量1.4w

点赞数 7

文章标签： matlab

本文链接：https://blog.csdn.net/sundreamoon/article/details/79874764

版权

本文介绍了如何利用K折交叉验证方法来选择KNN算法中的K值。通过在MATLAB中使用crossvalind函数，将数据集划分为K个子集，轮流将其中一个作为测试集，其余作为训练集，最后计算所有测试结果的平均分类率，以确定最佳的K值。实验证明，当K=3时，分类正确率最高。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前几天用KNN对自己的数据进行了分类，对于KNN中的K值，之前一直是靠缘分来试的，试的时候感觉K=3的效果挺好的。之后看了好多CSDN的博客，发现一般大家除了靠缘分去试K值之外，也会采用交叉验证的方法去近似求得K值，因此我决定自己实现一下，看看有什么效果。

交叉验证之前老师在将数据挖掘的时候简单的介绍了一下，那时候只记得10折交叉验证，而且并没有去实验，所以早就忘得一干二净。

K折交叉验证，在matlab中已经集成了函数crossvalind,可以直接调用。

所谓K折交叉验证（K-foldcross validation），其过程如下：

（1）将全部训练集S分成K个不相交的子集，假设S中的训练样例个数为m，那么每一个子集有m/k个训练样例。

（2）每次从分好的子集中，选出一个作为测试集，另外k-1个作为训练集。

（3）根据训练集得到模型。

（4）根据模型对测试集进行测试，得到分类率。

（5）计算k次求得的分类率的平均值，作为模型的最终分类率。

虽然计算过程比较繁琐，但是我觉得还可以，毕竟我的数据不是很多。。。。

datatrain = xlsread('traindata1.xlsx'); %读训练数据
traindata1 = datatrain(:,1:180); %训练样本
trainlabel1 =