KNN分类算法

KNN介绍

最近邻 (k-Nearest Neighbors, KNN) 算法是一种分类算法, 1968年由 Cover和 Hart 提出, 应用场景有字符识别、 文本分类、 图像识别等领域。
该算法的思想是: 一个样本与数据集中的k个样本最相似, 如果这k个样本中的大多数属于某一个类别, 则该样本也属于这个类别。

 

 

图中绿色的点就是我们要预测的那个点,假设K=3。那么KNN算法就会找到与它距离最近的三个点(这里用圆圈把它圈起来了),看看哪种类别多一些,比如这个例子中是蓝色三角形多一些,新来的绿色点就归类到蓝三角了。

 

但是, K=5这次变成红圆多一些,所以新来的绿点被归类成红圆。从这个例子中,我们就能看得出K的取值是很重要的。

KNN实现步骤

1. 计算距离(欧几里得距离或者马氏距离)

欧几里得距离(二维):

 

马氏距离:

 

2. 升序排列

3. 取前K个

K的取值

K太大:导致分类模糊

K太小:受个例影响,波动较大

4. 加权平均

经验

KNN算法求病人癌症检测的正确率

 

 

K值选择

通过交叉验证(将样本数据按照一定比例,拆分出训练用的数据和验证用的数据,比如6:4拆分出部分训练数据和验证数据),从选取一个较小的K值开始,不断增加K的值,然后计算验证集合的方差,最终找到一个比较合适的K值。
 

 

当你增大k的时候,一般错误率会先降低,因为有周围更多的样本可以借鉴了,分类效果会变好。但注意,和K-means不一样,当K值更大的时候,错误率会更高。这也很好理解,比如说你一共就35个样本,当你K增大到30的时候,KNN基本上就没意义了。

所以选择K点的时候可以选择一个较大的临界K点,当它继续增大或减小的时候,错误率都会上升,比如图中的K=10。具体如何得出K最佳值的代码
 

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
OpenCV是一个开源的计算机视觉库,提供了许多用于处理图像和视频的函数和算法。其中之一就是K最近邻(KNN分类算法KNN是一种监督学习算法,用于分类任务。它的基本思想是根据已知的训练样本,通过计算样本之间的距离来确定一个测试样本的类别。 下面是一个使用OpenCV实现KNN分类算法的示例代码: ```c #include <opencv2/opencv.hpp> #include <iostream> int main() { // 加载训练样本 cv::Mat trainData = (cv::Mat_<float>(4, 2) << 2, 4, 4, 2, 4, 4, 6, 2); cv::Mat trainLabels = (cv::Mat_<int>(4, 1) << 0, 0, 1, 1); // 创建KNN分类器对象 cv::Ptr<cv::ml::KNearest> knn = cv::ml::KNearest::create(); // 训练,传入训练数据和对应的标签 knn->train(trainData, cv::ml::ROW_SAMPLE, trainLabels); // 创建测试样本 cv::Mat testData = (cv::Mat_<float>(1, 2) << 6, 6); // 预测测试样本的类别 cv::Mat results, neighborResponses, dists; float response = knn->findNearest(testData, 3, results, neighborResponses, dists); // 打印预测结果 std::cout << "Predicted class: " << response << std::endl; return 0; } ``` 以上代码中,首先加载了4个训练样本,每个样本有2个特征。然后创建了一个KNN分类器对象,进行训练。接着创建了一个测试样本,使用KNN分类器进行预测,预测结果存储在response变量中。最后将预测结果打印出来。 需要注意的是,以上代码只是一个简单的示例,实际使用KNN分类器时,可能需要更多的训练样本和特征,并进行参数调优等操作。希望以上回答对您有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

KRay___

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值