《机器学习》KNN算法搭配OpenCV训练模型、识别图片 No.2

菜就多练_0828

已于 2024-08-26 16:57:22 修改

阅读量1.6k

点赞数 33

分类专栏：《机器学习》人工智能篇文章标签：机器学习人工智能 KNN算法 OpenCV

于 2024-08-16 22:18:54 首次发布

本文链接：https://blog.csdn.net/qq_64603703/article/details/141268969

版权

《机器学习》人工智能篇专栏收录该内容

24 篇文章 1 订阅

订阅专栏

3.2 ret、result、neighbours、dist 解析

一、使用KNN算法识别数字

1、明确目的：

有一张图片，其中有一份数据，其中共有0-9的不同写法的数字，共5000条，现在想要对这张图片中的数据进行训练，以完成当输入一张图片，图片内为手写的数字，能自动识别其数字的值为多少，从而完成训练。

2、获取数据

首先看下面一张图：

它的像素点为1000 x 2000，其中长有100个数据。宽有50个数据，共5000个数据

可能你看不清楚什么样的，那么不妨方法一下，其竖直方向排布如下：

3、明确操作流程

首先导入这张图片，将这张图片转换成灰度图（3.1解析灰度图），然后将这张图片中的每个数字提取出来，这张图片中的每个数字都是由20x20=400个像素点组成，将这每一个单独的数字存放的列表中，然后将列表使用np.reshape()函数转换成二维数组的形式，以便于后面的切分操作。

对存放所有数据的二维数组进行切分，前一半当做训练集，后一半当做测试集，这张图中0-9对应的每个数字都为5行100列，成上下排布，我们只对列作切半处理，不对行进行切分，由此来得到训练集和测试集的数据，但是这个数据还不能直接拿来训练，还需要将每单个数字中的20x20的像素点转变成一行，此时可以使用np.reshape()将其转变成1x400像素值的状态，以便于对其进行训练和测试。

接下来有了训练集和测试集，但是却没有标签集，此时可以生成一个0-9的数组，然后因为训练集中每个单个数据都有250个，即一共2500个，那么就要设置2500个标签用来对应这2500个数字，即可以使用np.repeat()来将0-9每个数字都复制250遍，然后再使用np.newaxis将这个一维数组生高成二维数组，以满足和训练集同样的维度。

最后就是开始训练数据了，这里使用OpenCV中的包cv2.ml的方法KNearest_Create() 来创建一个knn算法的分类器对象，并对其进行初始化，然后导入训练集以及训练标签，并使用cv2.ml.ROW_SAMPLE表示对每一行数据进行训练，接下来就是导入数据进行测试，使用knn.finNearest()导入数据并指定邻居个数，返回四个值ret、result、neighbours、dist，其解释在下列3.2。此时即完成全流程的解说。

3.1 什么是灰度图

灰度图是一种图像的表示方式，相比于彩色图像，灰度图仅包含一个灰度通道，即每个像素只有一个灰度级。灰度级通常用一个8位整数表示，范围从0（黑色）到255（白色），表示不同的亮度值。

在灰度图中，每个像素表示图像中某一点的亮度级别。亮度级别越高，该点在图像中就越亮；亮度级别越低，该点在图像中就越暗。因此，灰度图能够表示图像的明暗程度。

灰度图常用于图像处理领域和计算机视觉任务中。通过对灰度图进行处理，可以实现诸如图像增强、边缘检测、目标检测、人脸识别等功能。例如，对于目标检测任务，可以将灰度图作为输入，通过检测明暗程度变化或者轮廓来识别目标物体。

为了生成灰度图，可以将彩色图像转换为灰度图。一种常见的方法是使用加权平均法，根据红色、绿色和蓝色通道的亮度对应比例，计算出每个像素的灰度值。另外，还可以使用其他方法，如取最大值、取最小值等来生成灰度图。例如可以使用OpenCV中的方法：

import cv2

# 读取彩色图像
image = cv2.imread('color_image.jpg')

# 转换为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 显示灰度图
cv2.imshow('Gray Image', gray_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在以上代码中，首先使用cv2.imread()函数读取彩色图像，将图像保存在image变量中。然后，使用cv2.cvtColor()函数将彩色图像转换为灰度图，将灰度图保存在gray_image变量中。最后，使用cv2.imshow()函数显示灰度图窗口，并通过cv2.waitKey()和cv2.destroyAllWindows()函数等待关闭窗口。

注意，cv2.COLOR_BGR2GRAY参数表示将BGR格式的图像转换为灰度图。如果你的图像不是BGR格式，你可能需要根据实际情况选择不同的颜色空间转换函数。