2021SC@SDUSC
PaddleOCR的优势
- 数据标注工具PPOCRLabel
- 数据合成工具Style-text
- 算法库丰富
- 算法模块化,代码复用性高
- ppocr系列模型
- 丰富灵活的部署方式
简单理解一个深度学习算法
一个深度学习算法可以分为三个过程:训练过程,评估和推理过程
数据经过产生之后送到模型产生输出,和label进行一个损失的计算,最后根据优化器进行一个反向传递,来修正模型的参数,训练这个过程我们需要:数据,模型,loss还有优化器四个模块。
推理过程是数据通过模型输出,然后进行后处理,直接得到输出。
而评估过程多了一个指标评估,这里主要是考虑该模型是否完善。
paddleOCR–模块化对象
-
组件的模块化–》数据、模型、损失、优化器、后处理、评估指标六大块的模块化
-
组件内部的模块化–》六大板块内部模块化
paddleOCR–数据模块
operators存了一些对图片的基本操作。
paddleOCR–模型模块
paddleOCR–损失函数模块
paddleOCR–后处理函数模块
rec是识别算法的后处理,cls分类算法的后处理
paddleOCR–优化器模块
paddleOCR–指标评估模块
eval_det_iou.py 检测用到的类在这个文件夹里