都2021了，别再堆砌网络了！10万奖金悬赏最强轻量化OCR模型

最新推荐文章于 2024-06-14 09:39:25 发布

Amusi（CVer）

最新推荐文章于 2024-06-14 09:39:25 发布

阅读量429

点赞数

文章标签：人工智能机器学习 python 深度学习大数据

原文链接：https://aistudio.baidu.com/aistudio/competition/detail/75

版权

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

文字识别，尤其是对汉语和汉字的识别，对于当下及未来中国数字经济的发展具有重要意义。OCR（Optical Character Recognition,光学字符识别）技术已经在信息提取、拍照翻译、图像检索、场景理解等方面发挥出关键作用，在办公自动化系统、工厂自动化、在线教育、地图制作等诸多领域也可以看见其身影。

然而，自然场景下的中文识别存在较大难度。低分辨率时可能导致文字识别混乱，高分辨率下又可能因为光线差异影响识别效果。即使识别环境很好，现实中也存在狂草字体频现、语句排布混乱、字符复杂多样等情况。不仅如此，由于深度神经网络计算复杂度高，模型参数量大，限制了其在一些场景和设备上进行部署，特别是在移动嵌入式设备的部署。因此，对于模型大小的要求也变得越来越重要。

为了集结四方好手的技术对策，中国图象图形学学会（CSIG）主办了CSIG图像图形技术挑战赛，百度飞桨发布“轻量级文字识别”竞赛任务，以比赛形式聚焦业界痛点，寻找最佳解决方案，助力你的模型落地于产业实践！

本次挑战赛提供大规模的中文场景文字识别数据，要求参赛选手兼顾准确率指标与模型大小，并重点考察选手的网络结构设计与训练调优能力。本次挑战赛旨在为研究者提供学术交流平台，进一步推动中文场景文字识别算法与技术的突破。

本次比赛的冠、亚、季军队伍有资格参加总决赛，中国图象图形学学会将组织专家担任总决赛的评委，根据各赛道冠、亚、季军队伍的现场答辩情况评选出总决赛的冠、亚、季军，总结赛及颁奖将在2021年8月6日-8日的ICIG2021会议期间举行。

解锁更多比赛福利

10万元现金奖池大放送
5月12日直播解题及答疑
100小时 GPU算力免费申领
视频课程、基线代码免费获取

扫描下方二维码即可报名获取比赛专属福利！

赛题简介

本次挑战赛以轻量级文字识别技术创新为主题，提供12万中文场景文字识别数据，要求参赛选手对图像区域中的文字行进行预测，返回文字行的内容。本赛题的关注点不仅仅局限于准确性指标，而是增加了对真实产业实践的考虑。要求参赛选手兼顾准确率指标与模型大小，重点考察选手的网络结构设计与训练调优能力。

扫码，加入比赛技术交流群

PaddleOCR

本次比赛由PaddleOCR资深研发团队提供技术支持。PaddleOCR在短短半年时间内，累计Star数量已超过12K，频频登上Github Trending和Paperswithcode 日榜月榜第一，更在《Github 2020数字洞察报告》中被评为中国Github Top20活跃项目。目前，PaddleOCR开发套件已打造出3种检测算法、6种检测模型、5种识别算法、9种识别模型，支持全球80+语言模型，更有详尽的中英文文档教程，为不同场景下的应用需求提供更有针对性的帮助。

富家不用买良田，书中自有千钟粟。自古以来读书人的心愿，无非是行万里路，读万卷书。而如今随着OCR技术的发展成熟，书中的种种皆可一蹴而就，唯独缺少OCR自身的技术演进。如果你也想成为飞桨大赛中的耀眼明星，也想为OCR技术发展添砖加瓦，那就赶快报名参赛吧！

点击阅读原文即可报名，参加竞赛！访问下面链接，即可体验超强OCR工具：

https://github.com/PaddlePaddle/PaddleOCR