ICDAR 2019比赛及数据集下载- 任务-ICDAR 2019多语言场景文本检测和识别的稳健阅读挑战

最新推荐文章于 2024-04-23 03:12:52 发布

qq_41895190

最新推荐文章于 2024-04-23 03:12:52 发布

阅读量2.5k

点赞数

分类专栏：深度学习户外文字识别中文识别文章标签： ICDAR 2019 多语言场景文本检测多语言场景文本识别稳健阅读挑战 ICDAR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41895190/article/details/103253859

版权

ICDAR 2019比赛及数据集下载

https://rrc.cvc.uab.es/?ch=15&com=tasks

任务-ICDAR 2019多语言场景文本检测和识别的稳健阅读挑战

为了参加RRC-MLT-2019挑战赛，您必须至少参加一项任务。这是任务的描述。前三个任务与RRC-MLT-2017中的任务相似，但针对RRC-MLT-2019重新打开了它们，为数据集添加了新语言并提高了整个数据集的地面真实性。我们还将介绍有关End-2-End文本检测和识别的新任务。

任务1：多脚本文本检测

在此任务中，参与者方法应该能够概括为检测不同脚本的文本。此任务的输入是带有各种语言的嵌入文本的场景图像，并且需要在单词级别进行检测。

地面真相（GT）格式

注意：为此任务提供的GT包含的信息比该任务所需的信息更多，因为该GT也与任务3和4共享。因此，请确保您的方法生成的结果格式与“结果格式”段落中所述。

基本事实是根据单词边界框提供的。边界框不是面向轴的，并且由它们的四个角的坐标以顺时针方式指定。对于训练集中的每个图像，按照命名约定提供相应的UTF-8编码的文本文件：

gt_ [图片名称] .txt

文本文件是用逗号分隔的文件，其中每一行对应于图像中的一个文本块，并以以下格式给出其边界框坐标（顺时针为四个角），其脚本及其转录：

x1，y1，x2，y2，x3，y3，x4，y4，脚本，转录

有效的脚本是：“阿拉伯语”，“拉丁语”，“中文”，“日语”，“韩语”，“孟加拉语”，“印地语”，“符号”，“混合”，“无”

请注意，转录是在第9个逗号之后直至行尾的所有内容。不得使用转义字符。

如果将抄写提供为“ ###”，则将文本块（单词）视为“无关紧要”。一些“无关”单词具有与语言相对应的脚本类，而其他一些则具有“无”脚本类。后一种情况是由于分辨率低或其他失真而无法识别单词脚本的情况。

结果格式

预期的本地化（检测）结果如下：预期每个测试图像一个UTF-8编码的文本文件。要求参与者将所有结果提交到一个zip文件中。结果文件应遵循命名约定以测试图像ID命名：

res_ [图片名称] .txt

（例如res_1245.txt）。每行应对应图像中的一个单词，并以以下格式提供其边界框坐标（顺时针四个角）和置信度得分：

x1，y1，x2，y2，x3，y3，x4，y4，置信度

评价

f度量（Hmean）用作对参与者方法进行排名的度量。标准f量度基于与基本事实相比所检测到的单词边界框的召回率和精度。如果检测到的边界框与GT框的重叠量大于50％（并交相交），则认为检测正确（真阳性）。如何计算分数的详细信息在本文的III-B部分中：MLT2017

问题：任务1和3：我们是否应该检测到“无关”框（转录为“ ####”），将如何评估？
答：“无关”框不计入评估。这意味着检测或遗漏无关框不会影响您的最终分数。

任务2：裁剪Word脚本识别

我们的数据集图像中的文本以10种不同的语言显示，其中一些共享相同的脚本。另外，标点符号和一些数学符号有时会显示为单独的单词，这些单词被分配了一个特殊的脚本类，称为“符号”。因此，我们共有8个不同的脚本。我们已排除了此任务中具有“混合”脚本的单词。我们也排除了所有“无关”字眼，无论它们是否具有已识别的脚本。

基本真理格式

对于单词脚本识别任务，我们将数据集中的所有单词（裁剪的单词）作为单独的图像文件提供，并提供相应的地面脚本和抄录。在此任务中不使用转录，可以忽略。对于每个文本块，都提供了紧密包含文本块的面向轴的区域。

整个集合的单个UTF-8文本文件中提供了所有单词的脚本和抄本。地面真相文件中的每一行具有以下格式

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
ICDAR 2019比赛及数据集下载- 任务-ICDAR 2019多语言场景文本检测和识别的稳健阅读挑战

ICDAR 2019比赛及数据集下载https://rrc.cvc.uab.es/?ch=15&com=tasks任务-ICDAR 2019多语言场景文本检测和识别的稳健阅读挑战为了参加RRC-MLT-2019挑战赛，您必须至少参加一项任务。这是任务的描述。前三个任务与RRC-MLT-2017中的任务相似，但针对RRC-MLT-2019重新打开了它们，为数据集添加了新语言并提高...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。