c++ opencv与Tesseract文字提取

3 篇文章 0 订阅

使用Tesseract文字提取之前,我们可以先使用opencv处理一下图片。最简单的例子如下所示:


//识别
void _characterIdentify()
{

string path = "C:/Users/Desktop/11/9.jpg";
    Mat img = imread(path);

    cv::Mat gray, binary;
    // 转换为灰度图像
    cv::cvtColor(img, gray, cv::COLOR_BGR2GRAY);
    cv::threshold(gray, binary, 0, 255, cv::THRESH_BINARY | cv::THRESH_OTSU);

    // 反转二进制图像,得到文字区域
    cv::bitwise_not(binary, binary);

    //imshow("binary", binary);
    //waitKey(0);

    tesseract::TessBaseAPI ocr;
    int ret = ocr.Init("E:\\qt\\Project\\TesseractSample\\Debug\\tessdata", "chi_sim");
    ocr.SetImage(binary.data, binary.cols, binary.rows, 1, binary.step1());

    char* outText = ocr.GetUTF8Text();
    std::string strrrr = Coding::UTF8ToGB2312(outText);

    std::cout << strrrr;
    delete[] outText;
    ocr.End();

}

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值