PubLayNet 是一个大型文档图像数据集,其布局用边界框和多边形分割进行了注释。文件来源为PubMed Central Open Access Subset(商业用途合集)。注释是通过匹配 PubMed Central Open Access 子集中文章的 PDF 格式和 XML 格式自动生成的。更多详细信息,请参阅我们的论文“PubLayNet:用于文档布局分析的最大数据集”。.
PubLayNet 文档图像数据集
最新推荐文章于 2025-04-23 16:43:57 发布
PubLayNet 是一个大型文档图像数据集,其布局用边界框和多边形分割进行了注释。文件来源为PubMed Central Open Access Subset(商业用途合集)。注释是通过匹配 PubMed Central Open Access 子集中文章的 PDF 格式和 XML 格式自动生成的。更多详细信息,请参阅我们的论文“PubLayNet:用于文档布局分析的最大数据集”。.