openCvSharp4手写体识别

0、实验思路

(1)利用cv自带的图片digits.png,完成训练、手动切割出来的数字识别(本文完成);

(2)让上面的训练集合识别自己手写、经ps切割的单个数字图片;

(3)识别自己写的一行数字。

1、参考源

作者:十月ku

网址:OpenCVSharp4 识别物体系列之学习对象分类 - 简书

2、界面和思路

创建4个按钮,分别为切割并训练、识别内置、识别手写、识别一行手写

3、功能实现

(1)切割并训练,代码如下:

Mat img0 = Cv2.ImRead("digits.png", ImreadModes.Grayscale);
            Mat tTrainData = new Mat();
            Mat tTrainLabel = new Mat();
            int step = 20;
            //原图为1000*2000,每行2000/20=100个,共50行
            int rowsCount = img0.Rows / step;   
            int colsCount = 90;   //训练90,并把最后几个拿出来

            for (int i = 0; i < rowsCount; i++)//50行
            {
                int offsetRow = i * step;  //行上的偏移量
                for (int j = 0; j < colsCount; j++) //列数
                {
                    int offsetCol = j * step; //列上的偏移量
                    Mat temp = img0.SubMat(offsetRow, offsetRow + step, offsetCol, offsetCol + step).Clone();
                    temp=temp.Reshape(1,1);
                    tTrainData.PushBack(temp);
                    tTrainLabel.PushBack((int)(i / 5));
                }
            }

            tTrainData.ConvertTo(tTrainData, MatType.CV_32F);

            knn.Train(tTrainData, SampleTypes.RowSample, tTrainLabel);

            knn.Save("knn.xml");
            MessageBox.Show("ok");

(2)识别代码如下:

private void Button1_Click(object sender, RoutedEventArgs e)
        {
            knn.Read(new FileStorage("knn.xml", FileStorage.Modes.Read).GetFirstTopLevelNode());
            Mat temp = Cv2.ImRead("t3.png", ImreadModes.Grayscale).Clone();
            temp = temp.Reshape(1,1);
            temp.ConvertTo(temp, MatType.CV_32F);
            float res_f=knn.Predict(temp);
            MessageBox.Show(res_f.ToString());
        }

问题:

输出为整数,有时候会出错;由于不能输出为某一个数值的概率数值,放弃KNN,在测试完我自己的手写体识别后,转其他机器学习阵营。

附KNN原理

KNN全称是k-Nearest Neighbors,意思是K个最近的邻居。
KNN算法从名字上我们就可以很直观地看出它的原理:从所有的训练样本中找出和未知最近的K个样本,将k个样本中出现最多的类别就是赋给未知样本。

典型的原理说明图如下

 显然,如果参数k=3,三角形占了2/3,则输出三角形;k=5,正方形占了3/5,则认为是正方形。

从这里可以看出,分类应该就是整数,但各占多少,或者得到这个投票比值,需要看源代码。

另外,对于训练数据图片,训练前如果对图片进行锐化是否有影响?训练数据是否是自动阈值二值化的?上述问题都需要看源代码解决。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

健忘的松鼠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值