学习课程:gitee_PaddleOCR
学习论坛:Datawhale CLUB
天池比赛:“英特尔创新大师杯”深度学习挑战赛 赛道1:通用场景OCR文本识别任务
1.故事还要从20w说起
OCR比赛的概况如下图,大家加油为了五万!!!奥里给!
OCR的英文全称是Optical Character Recognition,非常古老的计算机命题。在1202年,各种AI大行其道的时代,这个古老的命题又被挖出来了。如果说之前是从环境中找文字给计算机读,现在是让计算机自己从环境中找读有意思的信息,让计算机行万里路顺便读个万卷书。
2.真免费!我学会了用电脑识别图像里的文字
Baseline是在大名鼎鼎的百度开源OCR识别框架上更改的,首先,让我们了解下PaddleOCR。然后,学习如何白嫖这个框架进行OCR识别PaddlePaddleOCR安装教程。划重点:有了PaddleOCR,我再也不用去网上找那些所谓的免费在线文字识别,我所需要的就是把图片路径复制到代码里,运行就ok啦!
感谢百度AIstudio的免费算力!
需要注意的是,把requirements.txt里的包pip install,然后记得把所用的yml配置文件中loader的num_workers改为0
3.观摩大佬如何调教PaddleOCR
test_list
数学公式自动识别生成器
N o r m = 1 − 1 N ∑ i = 1 N D ( s i , s i ^ ) / m a x ( s i , s i ^ ) Norm=1-\frac{1}{N}\sum_{i=1}^{N}D(s_i,\hat{s_i})/max(s_i,\hat{s_i}) Norm=1−N1i=1∑ND(si,si^)/max(si,si^)
跑奔了,然后又续上了
跑一遍baseline,分数6.2+,非常好!