opencv KNN 模型识别车牌汉字(C++)QT

  本文利用560个(14个汉字,每字40)车牌汉字样本构成knn数据集,140个汉字样本作为测试集(每字10);

总结:0、读取样本时先转为灰度图,通道数为1

           1、所用样本的宽高为28*28,将样本拉成28*28=784的向量,再塞进样本矩阵中(一个行数为样本总数600,列数为样本特征数784的矩阵),标签矩阵行数于样本矩阵行数必须相等,列数为1(600*1)

           2、样本和标签矩阵数据类型必须为CV_32F,且通道数要为1,否则会报错

           3、在构造标签矩阵时,尝试了下图中的方法,但标签矩阵内数据并不是目标数据(0或乱码),于是改用push_back的方法,输出矩阵正常

                                                                法一(有问题)

                                                                 法二(没问题)

 

标签矩阵输出结果:

预测结果与对应标签:

最终预测准确率为87%,测试样本只用了140,其中粤和陕正确识别率较低。

 

void MainWindow::knnTrain(cv::Mat &src,bool ChiMoe)
{

    using namespace std;
    using namespace cv;
    using namespace cv::ml;
    string province[15] = {"云","皖","苏","辽","闽","黑","京","川","沪","浙","湘","粤","陕","鲁"};
    Mat traindata,testData,trainlabel,testlabel;
    GenerateDataSet(traindata,testData,trainlabel,testlabel,ChiMoe);//生成训练和测试的数据和标签,具体实现见下文
    cout << format(testlabel,Formatter::FMT_NUMPY) << endl;//输出标签,开始时使用copyto函数构造标签矩阵,但是标签矩阵内数据都是0,改为push_back数据正常
    trainlabel.convertTo(trainlabel,CV_32FC1);//样本和标签需为CV_32F
    testlabel.convertTo(testlabel,CV_32FC1);
    //knn模型初始化
    cv::Ptr<cv::ml::KNearest> KNN = cv::ml::KNearest::create();
    KNN->setDefaultK(6);
    KNN->setIsClassifier(true);
    KNN->setAlgorithmType(cv::ml::KNearest::BRUTE_FORCE);
    KNN->train(traindata,cv::ml::ROW_SAMPLE,trainlabel);
    Mat result;
    KNN->findNearest(testData,6,result);
    int t=0,f=0;//记录正确与错误数量
    for(int i=0;i<140;++i){
       int predict = int(result.at<float>(i));
       int actual = int(testlabel.at<float>(i));
       if(predict==actual){
           qDebug() << "predict: " << predict << "actual: " << actual << "Y" << endl;
           t++;//正确识别数
       }
       else{
           qDebug() << "predict: " << predict << "actual: " << actual << "X" << endl;
           f++;//错误识别数
       }
    }
    qDebug() << "The Correct Rate:" << float(t)/float(140) << endl;//输出识别正确率

}

数据集生成函数:

void MainWindow::GenerateDataSet(cv::Mat &trainData, cv::Mat &testData, cv::Mat &trainLabel, cv::Mat &testLabel,bool ChiMode)
{
    using namespace std;
    using namespace cv;
    string province[14] = {"云","皖","苏","辽","闽","黑","京","川","沪","浙","湘","粤","陕","鲁"};
    Mat data,label;
    for(size_t i=0;i<14;++i){

        for(int j=1;j<=40;++j){
        string path = "/home/ghoson-x/Desktop/qt/CarImage/data2/train_28_28/";
        path.append(province[i]).append("/").append(province[i]).append("_").append((QString::number(j)).toStdString()).append(".jpg");
        Mat tmp = imread(path,IMREAD_GRAYSCALE);
        if(tmp.empty()){
            break;
        }
        tmp.convertTo(tmp,CV_32FC1);
        trainData.push_back(tmp.reshape(0,1));//图片拉成一条784的向量
        }
        Mat tmp_label = Mat::ones(40,1,CV_32FC1);//各样本数为40,总计600
        tmp_label = tmp_label * i;
        trainLabel.push_back(tmp_label);
        //生成测试标签
        for(int k=1;k<=10;++k){
            string path = "/home/ghoson-x/Desktop/qt/CarImage/data2/test_28_28/";
            path.append(province[i]).append("/").append(province[i]).append("_").append((QString::number(k)).toStdString()).append(".jpg");
            Mat tmp = imread(path,IMREAD_GRAYSCALE);
            if(tmp.empty()){
                break;
            }
            tmp.convertTo(tmp,CV_32FC1);
            testData.push_back(tmp.reshape(0,1));
        }
        Mat test_label = Mat::ones(10,1,CV_32FC1);
        test_label = test_label * i;
        cout << format(test_label,Formatter::FMT_NUMPY) << endl;
        testLabel.push_back(test_label);
    }

}

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
使用VC++6.0做开发工具, 采用简单的SDI框架结构 ,一次处理一幅位图(有兴趣的可以作成MDI) 1)位图信息的数据是从左下往右下为一行,一行一行往上排的。 2)每行像素应该是4的倍数,不足的地方用空点补齐,读的时候注意跳过冗余点。 3)主要数据都存在Doc里面,BMP的主要数据存在一个由ImgData指向的BYTE型的内存空间(根据位图的大小,动态分配的)。 4)数据读进来以后,注 意向内存中贴图,以保证刷新的效率。 5)程序执行流程 应用程序生成--》打开--》CDipView的OnFileOpen 函数--》 调用CDipDoc的FileOpen 函数--》并使用myDoc->UpdateAllViews(NULL); 刷新 自动调用CDipView的OnPaint函数--》调用CDipView的OnDraw函数----一个像素点一个像素点的画 //+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 比较重要的地方 读BMP文件,只能打开256色 (可以是灰度) 显示和内存贴图技术 关于调色板: 调色板实际上是一个数组,4个BYTE 分别是 B,G,R,和 Reserved 每一个像素点都有一个相应的数组。 关于VC和windows 的绘图机制: 使用GDI(图形设备接口)对象,通常使用CDC 类,CPaintDC也一样(device-context)设备上下文 windows下的MFC编程机制,消息驱动,事件等待! 全局的app(应用程序对象) 注意 手工分配内存的清除 和CDC对象的删除 以释放系统的GDI资源 每一个new操作符都要对应一个delete 虽然已经弄出来了,还是希望大家好好读读源程序。 你们以后的工作: 在菜单中添加菜单项,通过ClassWizzard 生成消息响应函数(当然也可手动添加), 所有的操作应当是对 BYTE* ImgData;进行的。 在完成相应的功能后 将 isnewfile 和 isnewiamge 置为真 ,并使用myDoc->UpdateAllViews(NULL); 刷新 当然,可以更加有个性化一点,有能力的同学可以自己完成。 随着课程的进行,菜单功能逐渐丰富,最后完成基本的数字图像处理的功能,而不必最后一下完成一个大的作业。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值