- imagenet:
- cv领域数据集,是目前世界上图像识别最大的数据库,别名:ILSVRC2012
- 使用该数据吃模型结构的优势:
- 很多论文都使用了此数据集,和其他模型比较时,可直接引用结果
- 评价指标固定:top1,top5
- 基于以上两点可直接看出模型是否有提高
- 数据解析:
- 训练集有120多万自然图像,大概150个G,含有1000个类别的压缩包
- 验证集:有50000张图片,解压后直接是图像,没有按照类别区分开
- places 数据集:
- 有1000万张场景分类图片,用场景语义类别作标签,包括世界上大量类型的环境变量。
- 更多可参考链接:https://blog.csdn.net/fujikoo/article/details/110189287
- place2数据集:
- 总共包含1000万张图片,400多个独特的场景类别,每个分类具有5000至30000个训练图像,与现实世界中的场景频次一致。
- 通常用于图像恢复和场景识别:更多可参考:https://blog.csdn.net/sinat_28442665/article/details/110933850
场景分类任务可用数据集(部分)
于 2022-07-28 08:55:29 首次发布