ICDAR 2019比赛及数据集下载
https://rrc.cvc.uab.es/?ch=14&com=tasks
任务-ICDAR2019任意形状文本的鲁棒阅读挑战
我们提议的比赛包括三个主要任务:
- 场景文字检测,
- 场景文字识别
- 场景文字发现。
注意
参赛者可以自由使用公开可用的数据集(例如ICDAR2015,MSRA-TD500,COCO-Text和MLT。)或合成图像作为本次比赛的额外训练数据,而不允许公开访问的私人数据不被使用。
基本事实格式
任务1和3
我们按照命名约定创建一个覆盖数据集中所有图像的JSON文件,以结构化格式存储基本事实:
gt_ [image_id],其中image_id表示数据集中图像的索引。
在JSON文件中,每个gt_ [image_id]对应于一个列表,其中列表中的每一行对应于图像中的一个单词,并以以下格式给出其边界框坐标,转录,语言类型和难度标志:
{
“ gt_1”:[{“点”:[[x1,y1],[x2,y2],…,[xn,yn]],“转录”:“ trans1”,“语言”:“拉丁语”,“难以辨认“:false},
…
{“点”:[[x1,y1],[x2,y2],…,[xn,yn]],“转录”:“ trans2”,“语言”:“中文”,“难以辨认”:false}] ,
“ gt_2”:[
{“ points”:[[x1,y1],[x2,y2],…,[xn,yn]],“ transcription”:“ trans3”,“ language”:“ Latin”,“难以辨认”:false}] ,
……
}
其中“点”中的x1,y1,x2,y2,...,xn,yn是多边形边界框的坐标,可以是4、8、10、12个多边形顶点。“转录”表示每个文本行的文本,“语言”表示转录的语言类型,可以是“拉丁”和“中文”。与COCOtext [3]和ICDAR2015 [2]相似,当设置为“ true”时,“模糊性”表示“无关”文本区域,这不会影响结果。
任务2
给定的输入将是带有相应文本实例的裁剪图像块,以及相对的多边形空间坐标。与任务1相似,对于数据集中的所有图像,我们按照命名约定创建一个JSON文件以结构化格式存储基本事实:
gt_ [image_id],其中image_id表示数据集中图像的索引。
{
“ gt_1”:[{“点”:[[x1,y1],[x2,y2],...,[xn,yn]],“转录”:“ trans1”,“语言”:“拉丁语”,“难以辨认“:false}],
“ gt_3”:[{“点”:[[x1,y1],[x2,y2],...,[xn,yn]],“转录”:“ trans2”,“语言”:“拉丁语”,“难以辨认“:false}],
“ gt_3”:[{“点”:[[x1,y1],[x2,y2],...,[xn,yn]],“转录”:“ trans3”,“语言”:“拉丁语”,“难以辨认“:false}],
……
}
注意,多边形坐标