关于深度学习的数据集

 ImageNet数据集的详细内容

ImageNet Large-Scale Visual Recognition Challenge(ILSVRC)是Pascal Visual Object Challenge的子部分。ImageNet是一个数据库,有超过22000个种类,超过1500万张图片。

ILSVRC使用1000个类,每个类中有1000个图片。这1000个类一一对应于WorldNet的1000个同义子集。这1000个同义子集互相不重叠,对于同义子集,不是的祖先。这样的子集称为低层子集。这1000个子集是ImageNet层次结构的一部分。可以认为这个子集包含了1000个低层子集和他们所有的祖先。共有860个这样的祖先,被称为高层子集。在层次结构中,所有的低层特征称为叶节点,高层子集称为中间节点。尽管在ImageNet中低层子集会有子类,但ILSVRC2012并不考虑这些子类,ILSVRC2012的层次结构可以看作是对完整ImageNet结构的剪裁。ILSVRC竞赛中,所有的标记都是针对低层子集,参赛者必须预测这1000个低层子集标记之一,不考虑预测高层子集的结果,而且也没有高层子集的训练图片。

在ILSVRC中,子集信息可参见ILSVRC2012_devkit_t12中的data/meta.mat文件中的矩阵。

矩阵中的每一个行对应于一个子集,每一项中包含如下域值:

ILSVRC2012_ID是为每一子集分配的一个整数ID值,所有低层子集的ID值都在1到1000之间,所有高层子集的ID值都大于1000。所有的子集都是一句其ID值进行排序。提交预测结果时,ILSVRC2012_ID也作为相应子集的标记。

WNID是子集在WordNet中的ID。用于在ImageNet或WorldNet中唯一标记一个子集。包含训练图片的tar文件就是用WNID命名的。同样每一个训练图片也是用WNID命名的。

num_children是子集在剪裁后的结构中子孙的数目。对于低层子集其值为0,对于高层子集的值不为0。

children是子孙子集的ILSVRC2012_ID的向量。

wordnet_height是完整的ImageNet/WorldNet层次结构中到叶节点的最长路径的值。(完整的ImageNet/WorldNet层次结构中叶节点的wordnet_height值为0)

注意caffe使用的labelILSVRC2012_devkit是不一致的。ILSVRC2012_IDILSVRC2012_devkit的提供的编号。而caffe中图片的label是以图片所属子集的名字的ASC II的顺序排列,并依次从0999编号。本文提供的所有程序都是依据caffe的编号编写的。在caffe目录下的data/ilsvrc12/synset_words.txt文件查看子集/编号的对应

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度学习数据集的采集是深度学习算法的重要组成部分,准确、丰富的数据集可以显著提高算法的性能。以下是一份关于深度学习数据集的采集的建议: 1. 确定数据集的目标和范围:在开始采集数据之前,需要明确数据集的目标和范围,确定需要采集的数据类型、数量、质量等因素。例如,如果你要开发一个人脸识别算法,那么你需要采集包含人脸的图像数据集。 2. 收集数据源:确定数据集的目标和范围后,需要寻找合适的数据源。数据源可以是公共数据库、互联网上的图像或文本数据,也可以是自己采集的数据。 3. 数据采集:在数据源确定后,需要开始数据采集工作。这包括如何获取数据、采集数据的质量控制、数据处理方法等。例如,在采集图像数据时,需要考虑拍摄设备、光线、拍摄角度等因素,确保采集到的图像质量高且具有代表性。 4. 数据标注:数据标注是深度学习数据集采集过程中非常重要的一步,它是指将数据集中的每个样本打上标签或分类。例如,在人脸识别算法中,需要将每个人脸所属的人物打上标签。数据标注的质量对算法的性能有很大影响,需要仔细思考标注方法并进行质量控制。 5. 数据集管理:数据集采集完成后,需要对数据集进行管理和维护。这包括数据的备份、存储、整理、更新等工作。同时,需要对数据集进行评估,确保数据集的质量和适用性。 总体来说,深度学习数据集的采集需要仔细规划和执行,需要考虑多个因素,包括数据源、数据采集、数据标注、数据集管理等。只有具备完备、准确、丰富的数据集,才能让深度学习算法发挥最佳的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值