PaddleOCR学习笔记 01--PaddleOCR简介

PaddleOCR学习笔记 01-PaddleOCR简介

视频链接:https://www.bilibili.com/video/BV1nf4y1U7RX?p=4

官网地址:https://github.com/PaddlePaddle/PaddleOCR

入门教程:https://aistudio.baidu.com/aistudio/projectdetail/467229

OCR简介

image-20210319084824874

image-20210319084920478

image-20210319085015245

image-20210319085141214

image-20210319085309535

PaddleOCR开源情况

image-20210319085537431

image-20210319085604546

PaddleOCR文字检测算法

image-20210319085811326

17年cvpr,基于回归

弃用了anchor,多通道的FCN接一个NMS,对feature map的每个像素点都有一个检测结果

image-20210319090018061

image-20210319090217415

image-20210319090600079

image-20210319090825390

image-20210319090953127

基于分割的方法可以检测不规则的文本,更加准确。

image-20210319091228823

总的来说,在本地的话使用模型resnet50_vd比较好一些,在端侧使用mobilenetv3比较好些。

PaddleOCR文字识别算法

image-20210319091615079

image-20210319091916464

image-20210319092226967

image-20210319092246663

PaddleOCR总结

image-20210319092416895

image-20210319092450764

百度自研文本检测算法-SAST

image-20210319092558983

image-20210319093201559

百度自研文字识别算法-SRN

image-20210319093144856

image-20210319093624447

百度自研端到端算法-End2End-PSL***

image-20210319093803760

image-20210319094115799

image-20210319094201440

PaddleOCR 9m超轻量模型

image-20210319094237193

image-20210319094250137

image-20210319094323856

image-20210319094426465

image-20210319094457240

结束

image-20210319094822801

image-20210319094944208

image-20210319095010063

image-20210319095127265

image-20210319095228216

image-20210319095337424

image-20210319095419033

image-20210319095812466

image-20210319100522602

image-20210319100702474

PaddleOCR是一个基于深度学习的开源文字识别工具。其原理是通过利用神经网络模型对输入的图像进行文本检测和识别。 在文本检测方面,PaddleOCR采用了DB算法(Detection-based),该算法通过对图像进行二值化操作,并使用可变形卷积来提取文本区域的特征。然后使用标签生成和损失函数来训练模型,最后经过后处理步骤来优化检测结果。 在文字识别方面,PaddleOCR使用CRNN算法(Convolutional Recurrent Neural Network),该算法结合了卷积神经网络(CNN)和循环神经网络(RNN)的特点。在CNN部分,通过卷积层来提取图像的特征;在RNN部分,通过序列层对提取的特征进行序列建模;最后通过CTC(Connectionist Temporal Classification)来进行转录。 综上所述,PaddleOCR的原理是通过文本检测算法和文字识别算法来实现对图像中的文字进行检测和识别。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [【文字识别】PaddleOCR实战和算法解读](https://blog.csdn.net/weixin_44936889/article/details/114916600)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

肆十二

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值