Datawhale OCR竞赛实践 Task01:Baseline学习实践(4天)

学习课程:gitee_PaddleOCR
学习论坛:Datawhale CLUB
天池比赛:“英特尔创新大师杯”深度学习挑战赛 赛道1:通用场景OCR文本识别任务

1.故事还要从20w说起

OCR比赛的概况如下图,大家加油为了五万!!!奥里给!
OCR的英文全称是Optical Character Recognition,非常古老的计算机命题。在1202年,各种AI大行其道的时代,这个古老的命题又被挖出来了。如果说之前是从环境中找文字给计算机读,现在是让计算机自己从环境中找读有意思的信息,让计算机行万里路顺便读个万卷书。
在这里插入图片描述

2.真免费!我学会了用电脑识别图像里的文字

Baseline是在大名鼎鼎的百度开源OCR识别框架上更改的,首先,让我们了解下PaddleOCR。然后,学习如何白嫖这个框架进行OCR识别PaddlePaddleOCR安装教程划重点:有了PaddleOCR,我再也不用去网上找那些所谓的免费在线文字识别,我所需要的就是把图片路径复制到代码里,运行就ok啦!
在这里插入图片描述
感谢百度AIstudio的免费算力!
需要注意的是,把requirements.txt里的包pip install,然后记得把所用的yml配置文件中loader的num_workers改为0
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.观摩大佬如何调教PaddleOCR

test_list
在这里插入图片描述
数学公式自动识别生成器

N o r m = 1 − 1 N ∑ i = 1 N D ( s i , s i ^ ) / m a x ( s i , s i ^ ) Norm=1-\frac{1}{N}\sum_{i=1}^{N}D(s_i,\hat{s_i})/max(s_i,\hat{s_i}) Norm=1N1i=1ND(si,si^)/max(si,si^)

在这里插入图片描述

跑奔了,然后又续上了
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
跑一遍baseline,分数6.2+,非常好!
在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值