ICDAR2019数据集下载与使用
官网下载
Github地址
ICDAR 2019(cTDaR)将评估表检测(TRACK A)和表识别(TRACK B)方法的性能。对于第一个轨迹,提供包含一个或多个表的文档图像。对于轨迹B,存在两个子轨迹:第一个子轨迹(B.1)提供表格区域。因此,只需执行表结构识别。第二个子轨迹(B.2)不提供先验信息。这意味着必须进行表区域和表结构检测。
重要提示:
- 对于现代数据集,没有可用于轨迹B的训练数据。请注意,现代数据集具有不同的注释(内容的边界框描述的是与历史数据集不同的单元格区域,而单元格区域由单元格区域描述),因此请求的输出也不同。
- 现代数据集的样本前缀为“cTDaR_t1”,历史数据集的样本以“cTDaR_t0”开头。
更新说明:
发布了一个补充数据集版本ICDAR2019数据集补充,在邻接关系方面是一个有用的子集,来自中国科学院自动化研究所刘成林教授组 .