datawhale OCR竞赛task01

本次“英特尔创新大师杯”深度学习挑战赛聚焦OCR技术,旨在提升复杂场景下的文字识别能力。OCR技术已广泛应用于证件识别、物流分拣等领域,但面对复杂图文场景仍有挑战。参赛者将利用提供的数据和基线模型(pdocr)进行优化,以满足各行业对高精度OCR算法的需求。建议使用Linux环境进行开发。
摘要由CSDN通过智能技术生成

一.比赛主题

本次比赛为"英特尔创新大师杯”深度学习挑战赛,其主要目的是OCR的识别https://tianchi.aliyun.com/competition/entrance/531902/introduction

二.简介

OCR (Optical Character Recognition,光学字符识别)是最早的计算机视觉任务之一。人类使用电子设备(图像采集装置)采集现实场景中打印的字符,然后通过检测字符的形状,用字符识别的方法将其翻译成计算机文字。随着技术的发展,OCR已经逐渐应用到社会的各种需求中。如今,我们可以在各个行业领域中看到OCR的广泛用途,包括:证件、车牌识别;物流分拣;智慧医疗;无纸化办公;文档检索等等。因此,在互联网时代中,OCR的应用算法,具有很大的商业价值。

在一些简单环境下,例如电子文档的识别,OCR的识别的准确率已经可以达到很高的水准。但是,OCR技术依然面临着很多难点,一些以往的算法在处理复杂图文场景里的文字时,依旧显得力不从心。因此,阿里云计算平台事业部团队联合英特尔举办此次OCR任务竞赛,旨在解决复杂场景中通用OCR识别的难点,以满足人们在不同行业应用中的需求。

三.比赛数据在这里插入图片描述

四.baseline

https://tianchi.aliyun.com/forum/postDetail?spm=5176.12586969.1002.6.32eb46d7ionoME&postId=244091
采用的是百度paddlepaddle框架下的pdocr,baseline中包括数据的整理,还有训练需要的脚本格式

五.注意事项

1.建议优先采用Linux,win下或多或少会存在一些问题

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值