点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
文字识别,尤其是对汉语和汉字的识别,对于当下及未来中国数字经济的发展具有重要意义。OCR(Optical Character Recognition,光学字符识别)技术已经在信息提取、拍照翻译、图像检索、场景理解等方面发挥出关键作用,在办公自动化系统、工厂自动化、在线教育、地图制作等诸多领域也可以看见其身影。
然而,自然场景下的中文识别存在较大难度。低分辨率时可能导致文字识别混乱,高分辨率下又可能因为光线差异影响识别效果。即使识别环境很好,现实中也存在狂草字体频现、语句排布混乱、字符复杂多样等情况。不仅如此,由于深度神经网络计算复杂度高,模型参数量大,限制了其在一些场景和设备上进行部署,特别是在移动嵌入式设备的部署。因此,对于模型大小的要求也变得越来越重要。
为了集结四方好手的技术对策,中国图象图形学学会(CSIG)主办了CSIG图像图形技术挑战赛,百度飞桨发布“轻量级文字识别”竞赛任务,以比赛形式聚焦业界痛点,寻找最佳解决方案,助力你的模型落地于产业实践!
本次挑战赛提供大规模的中文场景文字识别数据,要求参赛选手兼顾准确率指标与模型大小,并重点考察选手的网络结构设计与训练调优能力。本次挑战赛旨在为研究者提供学术交流平台,进一步推动中文场景文字识别算法与技术的突破。
本次比赛的冠、亚、季军队伍有资格参加总决赛,中国图象图形学学会将组织专家担任总决赛的评委,根据各赛道冠、亚、季军队伍的现场答辩情况评选出总决赛的冠、亚、季军,总结赛及颁奖将在2021年8月6日-8日的ICIG2021会议期间举行。
解锁更多比赛福利
10万元现金奖池大放送
5月12日直播解题及答疑
100小时 GPU算力免费申领
视频课程、基线代码免费获取
扫描下方二维码即可报名获取比赛专属福利!
赛题简介
本次挑战赛以轻量级文字识别技术创新为主题,提供12万中文场景文字识别数据,要求参赛选手对图像区域中的文字行进行预测,返回文字行的内容。本赛题的关注点不仅仅局限于准确性指标,而是增加了对真实产业实践的考虑。要求参赛选手兼顾准确率指标与模型大小,重点考察选手的网络结构设计与训练调优能力。
扫码,加入比赛技术交流群
PaddleOCR
本次比赛由PaddleOCR资深研发团队提供技术支持。PaddleOCR在短短半年时间内,累计Star数量已超过12K,频频登上Github Trending和Paperswithcode 日榜月榜第一,更在《Github 2020数字洞察报告》中被评为中国Github Top20活跃项目。目前,PaddleOCR开发套件已打造出3种检测算法、6种检测模型、5种识别算法、9种识别模型,支持全球80+语言模型,更有详尽的中英文文档教程,为不同场景下的应用需求提供更有针对性的帮助。
富家不用买良田,书中自有千钟粟。自古以来读书人的心愿,无非是行万里路,读万卷书。而如今随着OCR技术的发展成熟,书中的种种皆可一蹴而就,唯独缺少OCR自身的技术演进。如果你也想成为飞桨大赛中的耀眼明星,也想为OCR技术发展添砖加瓦,那就赶快报名参赛吧!
点击阅读原文即可报名,参加竞赛!访问下面链接,即可体验超强OCR工具:
https://github.com/PaddlePaddle/PaddleOCR