openCvSharp4手写体识别

健忘的松鼠

已于 2022-02-16 09:21:26 修改

阅读量808

点赞数

文章标签： vs2019 opencvSharp4 knn

于 2022-02-15 22:34:35 首次发布

本文链接：https://blog.csdn.net/zzlwl/article/details/122947770

版权

0、实验思路

（1）利用cv自带的图片digits.png，完成训练、手动切割出来的数字识别（本文完成）；

（2）让上面的训练集合识别自己手写、经ps切割的单个数字图片；

（3）识别自己写的一行数字。

1、参考源

作者：十月ku

网址：OpenCVSharp4 识别物体系列之学习对象分类 - 简书

2、界面和思路

创建4个按钮，分别为切割并训练、识别内置、识别手写、识别一行手写

3、功能实现

（1）切割并训练，代码如下：

Mat img0 = Cv2.ImRead("digits.png", ImreadModes.Grayscale);
            Mat tTrainData = new Mat();
            Mat tTrainLabel = new Mat();
            int step = 20;
            //原图为1000*2000,每行2000/20=100个，共50行
            int rowsCount = img0.Rows / step;   
            int colsCount = 90;   //训练90，并把最后几个拿出来

            for (int i = 0; i < rowsCount; i++)//50行
            {
                int offsetRow = i * step;  //行上的偏移量
                for (int j = 0; j < colsCount; j++) //列数
                {
                    int offsetCol = j * step; //列上的偏移量
                    Mat temp = img0.SubMat(offsetRow, offsetRow + step, offsetCol, offsetCol + step).Clone();
                    temp=temp.Reshape(1,1);
                    tTrainData.PushBack(temp);
                    tTrainLabel.PushBack((int)(i / 5));
                }
            }

            tTrainData.ConvertTo(tTrainData, MatType.CV_32F);

            knn.Train(tTrainData, SampleTypes.RowSample, tTrainLabel);

            knn.Save("knn.xml");
            MessageBox.Show("ok");

（2）识别代码如下：

private void Button1_Click(object sender, RoutedEventArgs e)
        {
            knn.Read(new FileStorage("knn.xml", FileStorage.Modes.Read).GetFirstTopLevelNode());
            Mat temp = Cv2.ImRead("t3.png", ImreadModes.Grayscale).Clone();
            temp = temp.Reshape(1,1);
            temp.ConvertTo(temp, MatType.CV_32F);
            float res_f=knn.Predict(temp);
            MessageBox.Show(res_f.ToString());
        }

问题：

输出为整数，有时候会出错；由于不能输出为某一个数值的概率数值，放弃KNN，在测试完我自己的手写体识别后，转其他机器学习阵营。

附KNN原理

KNＮ全称是k-Nearest Neighbors，意思是Ｋ个最近的邻居。
ＫNN算法从名字上我们就可以很直观地看出它的原理：从所有的训练样本中找出和未知最近的K个样本，将k个样本中出现最多的类别就是赋给未知样本。

典型的原理说明图如下