1前言
查看华为开发者联盟网站的机器学习服务业务介绍(https://developer.huawei.com/consumer/cn/doc/development/HMS-Guides/ml-introduction-4)
可以看到华为HMS把机器学习服务纳入了文本类,语言类,图片类,人脸人体类四大服务,后面新特性同时不断增加中,其中某些类是文本类服务,文本类服务里面又含了文本识别,文档识别,身份证识别,银行卡识别,通用卡证识别,这些子服务之间都有一些差异和关联呢,可能很多小伙伴会傻傻分不清,今天小编重点剖析下文本类服务,来看下这几个子服务间的差异和关联。
2应用场景差异
首先看下文本类服务包含的子服务内容和对应的场景差异
服务 | 场景差异 | 说明 |
---|---|---|
文字识别 | 稀疏的文本,收据,名片 | 支持的识别范围和场景“广”,啥都能识别,只要是拉丁字符,日韩,中英的文字都可以识别。 |
文档识别 | 包含文档的密集文本图片,尺寸文章,合同等 | 需要识别出带一级格式的文本信息,此处需要更多云端的运算能力,有更广泛的语言种类支持能力。 |
身份证识别 | 中国大陆二代身份证识别 | 支持的识别范围和场景很“专”,只识别大陆身份证,准确率高。 |
银行卡识别 | 全球常见的银行卡(银联,运通,万事达,Visa,JCB)卡号等关键信息识别 | 支持的识别范围和场景很“专”,只识别银行卡,准确率高。 |
通用卡证识别 | 任意固定板式的卡证,包括会员卡,通行证,工卡等 | 支持和识别范围和场景介于文本识别和身份证,银行卡识别之间,只要是卡证都可以进行识别。 |
文本类服务SDK有设备端API和云侧API接口两种,设备端的API只在设备端进行处理和分析,使用的是设备自身CPU,GPU等器件的算力,云端的API则需要把数据送到云端,利用云端的服务器资源进行处理和分析,以上服务除文档识别通过计算量吞吐量需要在云端进行处理外,其他服务共用设备端API,本次为了简化分析的范围,我们只讲设备端API服务部分。
2.1场景对比总结
通过以上对比表格我们可以看到,不同能力对应的应用场景是有所不同的:
-
2.1.1文本识别:更像是一个全科考生,上知天文下知地理,只要是文本,都可以识别。
文本识别使用场景
文本识别服务本身不提供界面,界面由开发者实现