手写数字识别【QT+OpenCV】

29 篇文章 43 订阅
25 篇文章 0 订阅

【说明】

手写数字识别的实现方式很多。

本文尽量将其简化,以让大家能够快速了解怎样实现一个动起来的系统。

【截图】




【思路】

1.特征提取

将图像划分为5*5大小的区域,然后计算该区域内黑色(或白色)的像素点所占比例。

将需要测试的图像、用来分类的图像都进行特征提取。

2.计算当前的测试图像与用来分类的图像之间的欧氏距离。

3.找出欧式距离最小的值即为与当前测试图像最匹配的图像,即将该图像所代表的数字作为当前测试图像的结果。

4.为了处理上的方便,做了简化处理如下:

4.1仅仅选用10幅用来分类的图像。

在实际应用中,10幅图像远远是不够的。但是为了简化程序,这里仅仅选用10幅图像,即数字0~9每个数字仅仅选用了一个特征。

在实际系统内,当选用的特征图像越多时,系统的准确度越高。

4.2采用了最近邻。即选用欧式距离最小的图像作为当前测试图像的结果。

在实际系统中,往往需要采用K近邻,即选择最小的K个欧式距离,判断他们分别属于哪个类从而决定当前数字结果。

因为简化的原因,数字识别的正确率不是很高。但是基本能够满足学习的需求。

【部分代码】

该系统采用QT+OpenCV开发完成,部分代码如下:

【主类内变量及槽函数】

public:
    explicit MainWindow(QWidget *parent = 0);
    ~MainWindow();
    cv::Mat testImage,srcImage[10],tempImage;//testImage值要测试的数字图像,srcImage指已经有的用来实现分类的数字图像
    QImage img;
    float testFeature[25];//该数组用来存储待检测数字图像的特征值。
    float srcFeature[10][25];//用来存储原始数字图像的特征值。只有10个数字0~9的图像
    void getFeature(cv::Mat m,float a[25]);//这里定义一个获取图像特征的函数。
    float ouDistance(float a[25],float b[25]);
    float oDistance(float a[25],float b[25]);


private slots:
         void on_openLenaJpg_triggered();

         void on_exitSystem_triggered();

         void on_openCustomeFile_triggered();

         void on_restoreFile_triggered();

         void on_copyright_triggered();

         void on_about_triggered();

         void on_showImage_triggered();

         void on_showMessage_triggered();

         void on_ImageAndMessage_triggered();

【打开自定义路径待测图像】

void MainWindow::on_openCustomeFile_triggered()
{
    QString filename = QFileDialog::getOpenFileName(this,tr("Open Image"),"",tr("Image File(*.bmp *.jpg *.jpeg *.png)"));
    QTextCodec *code = QTextCodec::codecForName("gb18030");
    std::string name = code->fromUnicode(filename).data();
    testImage = cv::imread(name);
    if(!testImage.data)
    {
        QMessageBox msgBox;
        msgBox.setText(tr("未找到数据"));
        msgBox.exec();
    }
    else
    {
        cv::cvtColor(testImage,testImage,CV_BGR2RGB);
        img = QImage((const unsigned char*)(testImage.data),testImage.cols,testImage.rows, testImage.cols*testImage.channels(), QImage::Format_RGB888);
        ui->label1->clear();
        img=  img.scaled(ui->label1->width(), ui->label1->height());
        ui->label1->setPixmap(QPixmap::fromImage(img));
        //ui->processPushButton->setEnabled(true);
        //   ui->label1->resize(ui->label1->pixmap()->size());//设置当前标签为图像大小
        // ui->label1->resize(img.width(),img.height());

        //this->setWidget(label1);
    }
}

【图像特征提取:完成图像5*5=25个特征,每个特征表示该子区域内白像素个数】

void MainWindow::getFeature(cv::Mat m,float a[25])
{
    int M,N;  //用来存储图像m的宽高
    int i,j;
    M=m.cols;
    N=m.rows;
    for(i=0;i<25;i++)
        a[i]=0;
    //   QMessageBox::information(NULL, "Title", QString::number(m.at<uchar>(188,88)), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
    for(i=0;i<M;i++)
        for(j=0;j<N;j++)
            if(m.at<uchar>(i,j)==255)
            {
                //   a[i/5*5+j/5]++;   //这里计算错误,不能放入对应的特征值内
                //    QMessageBox::information(NULL, "Title", QString::number(5), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);

                // a[M/i*5+N/j]++;
                //a[M/(i+1)*5+N/(j+1)]++;
                a[i/(M/5)*5+j/(N/5)]++;
                //   QMessageBox::information(NULL, "Title","add", QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
            }
    for(i=0;i<25;i++)
    {
        // QMessageBox::information(NULL, "Title", QString::number(a[i]), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
        a[i]=a[i]/((M/5)*(N/5));
        //   QMessageBox::information(NULL, "Title", QString::number(a[i]), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
        //    QMessageBox::information(NULL, "Title", QString::number(5), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);


    }
    //  QMessageBox::information(NULL, "Title", QString::number(a[5]), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);

}

【欧氏距离计算,第二个函数是测试用的】

float MainWindow::ouDistance(float a[25],float b[25])   //这个函数居然忘记写MainWindow的类关系,调试好久,瀑布汗!
{
    int i;
    float distance=0;//开始忘记置零,出错呀!!!
    for(i=0;i<25;i++)
        distance+=(a[i]-b[i])*(a[i]-b[i]);
    distance=sqrt(distance);
    return distance;
}
float  MainWindow::oDistance(float a[25],float b[25])   //这个函数是ouDistance出问题时测试的,并没有用
{
    int i;
    float distance=0;   //开始忘记置零,出错呀!!!
    //,为了测试ouDistance函数,重写了oDistance发现问题,结果再次出现问题一直却一直在此函数修改。而调用函数用的还是ouDistance

    for(i=0;i<25;i++)
        distance+=(a[i]-b[i])*(a[i]-b[i]);
    distance=sqrt(distance);
    return distance;
}

【说明】

void MainWindow::on_copyright_triggered()
{
    QMessageBox::information(this,"版权",tr("本软件版权所有者为:天津职业技术师范大学。如果使用,请联系:lilizong#gmail"));
}

void MainWindow::on_about_triggered()
{
    QMessageBox::information(this,"关于",tr("本软件当前版本为1.0,由李立宗等人开发。如果有问题,欢迎联系:lilizong#gmail"));
    return;
}




【显示测试结果:一个图像、一个信息框】

void MainWindow::on_ImageAndMessage_triggered()
{
    int i;
    float min; //用来存储最小的欧式距离
    int mini;   //用来存储最小的欧氏距离的数字号。
    getFeature(testImage,testFeature);   //获取测试图像的特征值,并将其放到testFeature数组内。
    //  QMessageBox::information(NULL, "Title", QString::number(testFeature[6]), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
    //测试当前的testFeature是否正常
    /*
    for(i=0;i<25;i++)
     QMessageBox::information(NULL, "Title", QString::number(testFeature[i]), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
*/
    //  QMessageBox::information(NULL, "Title", QString::number(testImage.rows), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
    for(i=0;i<10;i++)
    {
        QString filePath,fileName,allName;
        filePath="image\\stand\\";    //当前图像目录
        fileName=".bmp";       //当前图像的扩展名
        allName=filePath+"\\"+QString::number(i)+fileName;  //i是文件名,使用QString::number(i)完成将其转换为QString类型,当前为数值型
        String s=allName.toStdString();    //转换为标准的字符串型,imread不识别QString类型
        srcImage[i] = cv::imread(s);
    }

    //以下部分用于测试上述代码是否能够将srcImage的值获取到。
    /*
    cv::cvtColor(srcImage[3],srcImage[3],CV_BGR2RGB);
    img = QImage((const unsigned char*)(srcImage[3].data),srcImage[1].cols,srcImage[1].rows, srcImage[1].cols*srcImage[1].channels(), QImage::Format_RGB888);
    ui->label1->clear();
    img=  img.scaled(ui->label1->width(), ui->label1->height());
    ui->label1->setPixmap(QPixmap::fromImage(img));
*/

    // 获取原始数字图像的特征值。
    for(i=0;i<10;i++)
        getFeature(srcImage[i],srcFeature[i]);
    /*
    for(i=0;i<25;i++)
                QMessageBox::information(NULL, "Title", QString::number(srcFeature[0][i]), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
  */
    float ouDistanceValue[10]={0};   //存储当前测试图像与已知的十个数字图像之间的欧氏距离
    for(i=0;i<10;i++)
    {
        ouDistanceValue[i]=ouDistance(testFeature,srcFeature[i]);
        //  ouDistanceValue[i]=i;
    }

    //总是不能得到结果,测试下ouDistance有没有问题。
    /*
    for(i=0;i<10;i++)
        QMessageBox::information(NULL, "Title", QString::number(ouDistanceValue[i]), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
    */
    mini=0;
    min=ouDistanceValue[0];  //给min赋个初始值,假设与数字0的距离最小。
    for(i=0;i<10;i++)
    {
        if(min>ouDistanceValue[i])
        {
            min=ouDistanceValue[i];
            mini=i;
        }
    }
    // QMessageBox::information(NULL, "Title", QString::number(mini), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
    //上述语句测试一下mini是否能够取得正确的值
    //将与当前测试图像匹配的图像显示在label2内
    cv::cvtColor(srcImage[mini],srcImage[mini],CV_BGR2RGB);
    img = QImage((const unsigned char*)(srcImage[mini].data),srcImage[mini].cols,srcImage[mini].rows, srcImage[mini].cols*srcImage[mini].channels(), QImage::Format_RGB888);
    ui->label2->clear();
    img=  img.scaled(ui->label2->width(), ui->label2->height());
    ui->label2->setPixmap(QPixmap::fromImage(img));
    //将当前图像的匹配结果显示在一个消息框内
    QMessageBox::information(NULL, "测试结果", "当前测试图像的识别结果为数字:"+QString::number(mini), QMessageBox::Yes | QMessageBox::No, QMessageBox::Yes);
}


本博文有视频教程,欢迎联系学习!

OpenCV在Qt creator内实现手写数字识别


### 回答1: Qt是一个跨平台的应用程序开发框架,而OpenCV是一个广泛用于计算机视觉和图像处理的开源库。结合QtOpenCV,我们可以很方便地使用它们来识别数字。 首先,我们需要使用OpenCV进行图像预处理。我们可以读取图像,然后将其转换为灰度图像,这样我们可以更好地提取数字的特征。接着,我们可以对图像进行二值化处理,将图像中的像素值转换为0和255,这有助于数字的分割和识别。 接下来,我们可以使用OpenCV内置的数字识别算法,如SVM(支持向量机)或KNN(k最近邻)来对数字进行识别。这些算法可以通过训练来学习不同数字的特征,并根据输入的图像进行预测。 在Qt中,我们可以创建一个用户界面来展示识别结果。我们可以使用Qt提供的图形类来显示原始图像和识别结果。我们可以在界面上放置一个按钮,以便用户可以选择要识别的图像。当用户点击按钮时,我们可以调用OpenCV识别函数,并将结果显示在界面上。 此外,我们还可以在Qt中添加一些额外的功能,如图像缩放、旋转和裁剪等。这些功能可以使用户更加方便地对图像进行预处理和编辑,以提高数字识别的准确性。 总的来说,使用QtOpenCV进行数字识别是非常方便和高效的。通过利用OpenCV的图像处理算法和Qt的用户界面库,我们可以快速地开发出一个功能强大的数字识别应用程序。 ### 回答2: QT是一个跨平台的C++应用程序开发框架,而OpenCV是一个用于计算机视觉和机器学习的开源库。结合使用QTOpenCV可以实现数字识别的功能。 在QT中,首先需要配置OpenCV库。可以从OpenCV官方网站上下载适合自己平台的OpenCV库,并将其配置到QT项目中。然后在QT中引入OpenCV相关的头文件和库文件。 接下来,可以使用OpenCV的图像处理功能来识别数字。首先,需要将图像加载到QT的图像对象中。然后,可以使用OpenCV提供的图像处理函数对图像进行预处理,例如灰度化、二值化等,以凸显数字的特征。 一旦图像预处理完成,就可以使用OpenCV的特征提取和机器学习算法来识别数字。常用的方法包括基于模板匹配的方法、基于特征提取的方法以及基于深度学习的方法。可以使用OpenCV提供的函数或者自定义函数来实现这些方法。 最后,将识别结果显示在QT的界面上,可以使用QT提供的控件来显示识别出的数字。也可以将识别结果保存到文件中或者与其他系统进行交互。 总体来说,使用QTOpenCV可以实现数字识别的功能。通过使用OpenCV的图像处理和机器学习算法,可以对数字进行准确的识别和分类。而QT提供的界面设计和显示功能可以让用户在友好的界面上使用和查看识别结果。 ### 回答3: QtOpenCV是两个强大的开源库,可以用于数字识别和图像处理。Qt是一个跨平台的C++应用程序开发框架,提供了丰富的图形界面和用户交互功能。而OpenCV是一个计算机视觉库,可以用于图像处理、特征提取和目标检测等任务。 在Qt中使用OpenCV进行数字识别,可以通过以下几个步骤来实现。 首先,需要加载和预处理图像。可以使用Qt提供的图像读取功能,将待识别的图像加载进内存中。然后,可以使用OpenCV的图像处理功能,如灰度化、二值化等,将图像转换为对于数字识别算法友好的格式。 其次,需要进行数字识别。可以使用OpenCV提供的数字识别算法,如基于机器学习的分类器或者深度学习的神经网络,对处理后的图像进行分析和判断。这些算法通常需要提前进行训练,并得到一个可以用于识别的模型。 最后,将识别结果展示给用户。可以使用Qt的图形界面功能,将识别数字显示在界面上,或者通过语音合成等方式与用户进行交互。 需要注意的是,数字识别是一个复杂的任务,需要充分理解和掌握相关算法和技术。同时,也需要收集和准备足够数量和质量的数字图像数据进行训练,以提高识别的准确性和鲁棒性。 综上所述,通过结合QtOpenCV,可以实现基于图像的数字识别功能,为用户提供便捷的数字识别体验。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

superdont

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值