简述
上篇文章记录了百度Ocr的两种模式用法,接下来这篇文章开始记录腾讯Ocr的使用方法。腾讯Ocr的通用印刷体识别模式使用比较简单,直接接入sdk即可,但手写体的识别相对比较麻烦,需要自己post表单(也可能是能用sdk的,但我是没有找到)
##通用文字识别
- 直接在Android Studio的app->build.gradle->dependencies中添加:
implementation 'com.qcloud:qcloud-image-sdk:2.3.6'
- 初始化识别程序:
ImageClient imageClient = new ImageClient(APPID, SecretId, SecretKey,
ImageClient.NEW_DOMAIN_recognition_image_myqcloud_com);
其中APPID、SecretId、SecretKey这些和百度一样是需要去注册获取的,具体获取方式没什么难度就不详说(点击前往腾讯AI开放平台)。最后一个参数是服务器域名,默认使用新域名,也就是:
ImageClient.NEW_DOMAIN_recognition_image_myqcloud_com
如果是老用户,修改为以下域名:
ImageClient.OLD_DOMAIN_service_image_myqcloud_com
- 开始进行文字识别:
GeneralOcrRequest request = new GeneralOcrRequest("", getBitmapFile(mBitmap));
try {
String orcResult = imageClient.generalOcr(request);
} catch (AbstractImageException e) {
e.printStackTrace();
}
GeneralOcrRequest的第一个参数是bucketName实际上没什么用(官方说是遗留字段,至少对我来说没什么用,不知道实际上是什么样子),可以直接用空字符填充,第二个参数是File,上面代码是我项目中从bitmap获取file文件的写法。代码中的orcResult即为文字识别结果,返回的是一段json数据,需要自己去转换,推荐使用fastjson框架。