ICDAR 2019比赛及数据集下载- 任务-ICDAR 2019多语言场景文本检测和识别的稳健阅读挑战

ICDAR 2019比赛及数据集下载

https://rrc.cvc.uab.es/?ch=15&com=tasks

任务-ICDAR 2019多语言场景文本检测和识别的稳健阅读挑战

为了参加RRC-MLT-2019挑战赛,您必须至少参加一项任务。这是任务的描述。前三个任务与RRC-MLT-2017中的任务相似,但针对RRC-MLT-2019重新打开了它们,为数据集添加了新语言并提高了整个数据集的地面真实性。我们还将介绍有关End-2-End文本检测和识别的新任务。

任务1:多脚本文本检测

在此任务中,参与者方法应该能够概括为检测不同脚本的文本。此任务的输入是带有各种语言的嵌入文本的场景图像,并且需要在单词级别进行检测。

地面真相(GT)格式

注意:为此任务提供的GT包含的信息比该任务所需的信息更多,因为该GT也与任务3和4共享。因此,请确保您的方法生成的结果格式与“结果格式”段落中所述。

基本事实是根据单词边界框提供的。边界框不是面向轴的,并且由它们的四个角的坐标以顺时针方式指定。对于训练集中的每个图像,按照命名约定提供相应的UTF-8编码的文本文件:

gt_ [图片名称] .txt

文本文件是用逗号分隔的文件,其中每一行对应于图像中的一个文本块,并以以下格式给出其边界框坐标(顺时针为四个角),其脚本及其转录:

x1,y1,x2,y2,x3,y3,x4,y4,脚本,转录

有效的脚本是:“阿拉伯语”,“拉丁语”,“中文”,“日语”,“韩语”,“孟加拉语”,“印地语”,“符号”,“混合”,“无”

请注意,转录是在第9个逗号之后直至行尾的所有内容。不得使用转义字符。

如果将抄写提供为“ ###”,则将文本块(单词)视为“无关紧要”。一些“无关”单词具有与语言相对应的脚本类,而其他一些则具有“无”脚本类。后一种情况是由于分辨率低或其他失真而无法识别单词脚本的情况。

结果格式

预期的本地化(检测)结果如下:预期每个测试图像一个UTF-8编码的文本文件。要求参与者将所有结果提交到一个zip文件中。结果文件应遵循命名约定以测试图像ID命名:

res_ [图片名称] .txt 

(例如res_1245.txt)。每行应对应图像中的一个单词,并以以下格式提供其边界框坐标(顺时针四个角)和置信度得分:

x1,y1,x2,y2,x3,y3,x4,y4,置信度

评价

f度量(Hmean)用作对参与者方法进行排名的度量。标准f量度基于与基本事实相比所检测到的单词边界框的召回率和精度。如果检测到的边界框与GT框的重叠量大于50%(并交相交),则认为检测正确(真阳性)。如何计算分数的详细信息在本文的III-B部分中:MLT2017

问题:任务1和3:我们是否应该检测到“无关”框(转录为“ ####”),将如何评估?
答:“无关”框不计入评估。这意味着检测或遗漏无关框不会影响您的最终分数。

任务2:裁剪Word脚本识别

我们的数据集图像中的文本以10种不同的语言显示,其中一些共享相同的脚本。另外,标点符号和一些数学符号有时会显示为单独的单词,这些单词被分配了一个特殊的脚本类,称为“符号”。因此,我们共有8个不同的脚本。我们已排除了此任务中具有“混合”脚本的单词。我们也排除了所有“无关”字眼,无论它们是否具有已识别的脚本。

基本真理格式

对于单词脚本识别任务,我们将数据集中的所有单词(裁剪的单词)作为单独的图像文件提供,并提供相应的地面脚本和抄录。在此任务中不使用转录,可以忽略。对于每个文本块,都提供了紧密包含文本块的面向轴的区域。

整个集合的单个UTF-8文本文件中提供了所有单词的脚本和抄本。地面真相文件中的每一行具有以下格式

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值