0. 课程目录
- 0.1. 课程介绍
从头开始带您训练一个营业执照专有识别模型,并部署成服务,供外部不调用。
本课程适合在校学生、在职人员、科研工作者。 - 0.2. 您能获得什么收获
1.掌握paddleocr使用,训练自己的垂直领域的ocr模型,提高工程实战能力
2.本项目中的数据集、训练源代码、部署源代码、问题答疑等
3.其他
1. 环境准备
- 1.1. 下载paddleocr并安装依赖环境
下载paddleocr并安装依赖环境。更快更速度的下载依赖环境 - 1.2. 安装数据标注依赖环境PPOCRLabel
安装数据标注依赖环境PPOCRLabel。更快更速度的下载依赖环境,遇到的问题解决
2. 处理数据
- 2.1. 标注营业执照数据
如何标注营业执照数据,标注过程中遇到问题该怎么解决。 - 2.2. 转换标注好的数据
PPOCRLabel标注好的数据转换为KIE格式数据
3. 训练模型
- 3.1. 文本检测理论知识以及算法
- 3.2. 训练ocr文本监测模型
- 3.3. 文本识别理论知识以及算法
- 3.4. 训练ocr文本识别模型
- 3.5. 关键信息抽取理论知识
关键信息抽取 (Key Information Extraction, KIE)指的是是从文本或者图像中,抽取出关键的信息。针对文档图像的关键信息抽取任务作为OCR的下游任务,存在非常多的实际应用场景,如表单识别、车票信息抽取、身份证信息抽取等。 - 3.7. 训练kie的ser模型