WiKipedia(弱相关数据集)
模态
图像(image)
文本
描述
维基百科数据集 是最广泛使用的跨媒体检索数据集。 它基于维基百科的“特色文章”,一个不断更新的文章集合。 “专题文章”共有29个类别,但实际上只考虑了10个最多的类别。 每篇文章根据其部分标题分为几个部分,该数据集最终生成为一组 2,866 个图像/文本对。 维基百科数据集作为跨媒体检索的重要基准数据集,自公开以来就被广泛使用。
该数据集共有2866对图像和文本对,分10个类别(单标签)
art
biology
geography
history
literature
media
music
royalty
sport
warfare
常用数据集划分
| dastset | modality | instance | feature | label |
| WikI | image text |
2173/231/462 2173/231/462 |

本文介绍了三个常用的多模态数据集:WiKipedia、PascalSentence和NUS-WIDE,用于图像-文本匹配和检索任务。WiKipedia数据集包含2866个图像/文本对,分为10个类别;PascalSentence数据集有1000个图文对,涵盖20个类别;NUS-WIDE数据集则拥有269,648张图像,涉及5018个独特标签。此外,还提及了PKUXMediaNet数据集,这是一个包含5种媒体类型的大型多模态数据集,涉及200个类别。
最低0.47元/天 解锁文章
2131

被折叠的 条评论
为什么被折叠?



