目录
一、介绍 2
1.1 模型介绍 2
1.2 MindStudio介绍 2
二、MindStudio工程创建 2
2.1 初始配置 2
2.2 创建工程 3
2.3 工程配置 7
三、代码获取 11
3.1 模型代码获取 11
3.2 脚本代码获取 12
3.3 推理工具获取 12
3.4 代码上传 12
四、模型转换 13
4.1 获取推理模型权重 13
4.2 转出onnx模型 14
4.3 转出om模型 15
五、推理 20
5.1 推理工具编译安装 20
5.2 数据预处理 21
5.3进行推理 23
5.4 文字识别效果 24
六、总结 26
一、介绍
本文将介绍如何使用MindStudio进行ch_PP-OCRv3_rec模型离线推理开发,并完成图像文字识别,主要内容包括MindStudio工程创建、模型转换、推理等内容。
1.1 模型介绍
ch_PP-OCRv3_rec是基于PP-OCRv3的中文文本识别模型,PP-OCRv3的识别模块是基于文本识别算法SVTR优化。SVTR不再采用RNN结构,通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息,从而提升文本识别能力。
1.2 MindStudio介绍
MindStudio是一套基于华为自研昇腾AI处理器开发的AI全栈开发工具平台,集成了工程管理、编译器、仿真器以及命令行开发工具包,提供网络模型移植、应用开发、推理运行及自定义算子开发等功能。通过MindStudio能够进行工程管理、编译、调试、运行、性能分析等全流程开发,支持仿真环境及真实芯片运行,提高开发效率。更多关于MindStudio的功能介绍可以通过官网获取,官网网址为:
https://www.hiascend.com/zh/software/mindstudio
本文按照MindStudio用户手册中的安装指南部分完成了MindStudio的安装,安装版本为MindStudio_5.0.RC2_win。安装指南链接为:
https://www.hiascend.com/document/detail/zh/mindstudio/50RC3/instg/instg_000002.html
二、MindStudio工程创建
2.1 初始配置
初次使用MindStudio提示是否导入配置,如下图,选择Do