腾讯Ocr文字识别

最新推荐文章于 2024-05-11 17:28:42 发布

Nbin_Newby

最新推荐文章于 2024-05-11 17:28:42 发布

阅读量826

点赞数

分类专栏： Android解决方案集文章标签： Ocr 文字识别

本文链接：https://blog.csdn.net/Nbin_Newby/article/details/88063383

版权

本文介绍了腾讯OCR的使用，包括通用印刷体和手写体文字识别。印刷体识别只需添加SDK并初始化，手写体识别则需要通过HTTP框架发送POST请求。对比百度OCR，腾讯的印刷体识别操作更简单，但识别率不高。总结中提到，对于印刷体，腾讯和百度的SDK表现接近，但手写体识别百度更优。最终作者选择了更适合项目需求的联机手写识别技术。

摘要由CSDN通过智能技术生成

简述

上篇文章记录了百度Ocr的两种模式用法，接下来这篇文章开始记录腾讯Ocr的使用方法。腾讯Ocr的通用印刷体识别模式使用比较简单，直接接入sdk即可，但手写体的识别相对比较麻烦，需要自己post表单（也可能是能用sdk的，但我是没有找到）
##通用文字识别

直接在Android Studio的app->build.gradle->dependencies中添加：

 implementation 'com.qcloud:qcloud-image-sdk:2.3.6'

初始化识别程序：

ImageClient imageClient = new ImageClient(APPID, SecretId, SecretKey,
ImageClient.NEW_DOMAIN_recognition_image_myqcloud_com);

其中APPID、SecretId、SecretKey这些和百度一样是需要去注册获取的，具体获取方式没什么难度就不详说(点击前往腾讯AI开放平台)。最后一个参数是服务器域名，默认使用新域名，也就是：

ImageClient.NEW_DOMAIN_recognition_image_myqcloud_com

如果是老用户，修改为以下域名：

ImageClient.OLD_DOMAIN_service_image_myqcloud_com

开始进行文字识别：

  GeneralOcrRequest request = new GeneralOcrRequest("", getBitmapFile(mBitmap));
        try {
            String orcResult = imageClient.generalOcr(request);
        } catch (AbstractImageException e) {
            e.printStackTrace();
        }

GeneralOcrRequest的第一个参数是bucketName实际上没什么用（官方说是遗留字段，至少对我来说没什么用，不知道实际上是什么样子），可以直接用空字符填充，第二个参数是File，上面代码是我项目中从bitmap获取file文件的写法。代码中的orcResult即为文字识别结果，返回的是一段json数据，需要自己去转换，推荐使用fastjson框架。