OCR模型开发示例(www.nb-ai.com)
本示例用于介绍如何在官网工作台进行OCR模型开发。
OCR模型用于检测工业场景的不同类型的字符,包含数字、字母、文字等其他特殊字符,实现复杂环境下字符的快速、高精度识别。
OCR模型开发共7个步骤:创建模型————上传图片————标注图片————训练模型————测试图片————导出模型————下载SDK。
下面示例是一个关于药盒钢印的OCR检测示例。目的是在药盒上提取生产日期、产品批号和有效期。预期得到的字符提取效果如下所示:
模型开发的具体步骤如下:
1.创建模型
在“AI模型开发”界面中,点击“新建模型”
输入模型名称(名称不超过20字),选择模型类型为“OCR识别”,点击确认就创建好了模型。
2.上传图片
点击“图库”,加载图片。点击“上传图片”
检查上传图片的要求,点击“立即上传”,选择图片并上传。
支持批量上传
上传完成后会展示上传结果,可以看到要上传的图片全部上传成功。这样就完成了图片的上传。
3.标注图片
进入标注界面,可以进行图片的标注。图中红框部分是工具栏。
工具栏左边是标注区,第一个是矩形框,可以用它来框住字符; 工具栏中间可以对图片进行缩放(滑动鼠标滑轮也可以对图片进行缩放); 工具栏右边是一些进阶功能。
OCR标注过程主要有二:
1.用工具栏中的矩形框框住单个字符
2.键入每个字符的标注
详细的标注规则及标注示例,请见“更多”————“标注示例”
4.训练模型
进入“训练”界面,点击“开始训练”
会出现如下界面,提示任务正在排队,等待即可。
然后模型开始训练,这个过程大概耗时10分钟。
5.模型测试
进入测试页面,点击“开始测试”,进行模型测试
测试完成会有如下提示,提示测试完成。如想查看测试效果,点击“查看测试结果”。
区域左上方会出现字符识别结果,在原图上会展示预测出的结果。
6.导出模型
进入下载页面,选择对应版本。
选择硬件型号,点击“导出模型”。
7.SDK下载
在下载页面,在“SDK下载”中。点击“下载SDK”。
如果您想了解SDK的详细使用说明和相关开发示例,您可以点击红框内的相关链接。