paddleOCR代码结构与设计思想

2021SC@SDUSC
请添加图片描述

PaddleOCR的优势

  1. 数据标注工具PPOCRLabel
  2. 数据合成工具Style-text
  3. 算法库丰富
  4. 算法模块化,代码复用性高
  5. ppocr系列模型
  6. 丰富灵活的部署方式

简单理解一个深度学习算法

一个深度学习算法可以分为三个过程:训练过程,评估和推理过程

请添加图片描述

数据经过产生之后送到模型产生输出,和label进行一个损失的计算,最后根据优化器进行一个反向传递,来修正模型的参数,训练这个过程我们需要:数据,模型,loss还有优化器四个模块。

请添加图片描述

推理过程是数据通过模型输出,然后进行后处理,直接得到输出。

请添加图片描述

而评估过程多了一个指标评估,这里主要是考虑该模型是否完善。

paddleOCR–模块化对象

  1. 组件的模块化–》数据、模型、损失、优化器、后处理、评估指标六大块的模块化

  2. 组件内部的模块化–》六大板块内部模块化
    请添加图片描述

paddleOCR–数据模块

请添加图片描述

operators存了一些对图片的基本操作。

请添加图片描述

paddleOCR–模型模块

请添加图片描述

paddleOCR–损失函数模块

请添加图片描述

paddleOCR–后处理函数模块

请添加图片描述

rec是识别算法的后处理,cls分类算法的后处理

paddleOCR–优化器模块

请添加图片描述

paddleOCR–指标评估模块

请添加图片描述

eval_det_iou.py 检测用到的类在这个文件夹里

  • 3
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值