![](https://img-blog.csdnimg.cn/c093174b81024985a6ed2f1795a77ffe.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据集
文章平均质量分 96
CV常用数据集介绍及使用方法
不吃饭就会放大招
人工智能领域专家博主
展开
-
连续学习入门(三):Permuted MNIST/Split MNIST/Sequential MNIST 数据集
本文介绍:1. 连续学习常用的评估数据集:Permuted MNIST,Split MNIST;2. 两个变种 MNIST 数据集在三种连续学习场景下(Task-IL,Domain-IL,Class-IL)的使用原创 2022-11-16 14:56:12 · 2755 阅读 · 0 评论 -
小样本数据集 (Few-shot Learning)
Few-shot Learning 常用数据集:1)CUB-200-2011;2)Omniglot;3)mini-ImageNet;4)tiered-ImageNet;5)CIFAR-FS;6)FC100原创 2022-09-13 10:28:18 · 5683 阅读 · 1 评论 -
Meta-Dataset 数据集介绍及处理
论文:Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Examples, ICLR 2020Meta-Dataset 提出的初衷:mini-ImageNet、tiered-ImageNet 等数据集虽然在训练和验证时使用的类别没有交集,但是从外观上看,验证时使用的类别在很大程度上与训练时使用的类相似。导致验证过程仍可 reuse 训练时学习到的 feature embedding。但是,这样就无法验证 model 是否真的原创 2022-07-05 08:46:08 · 4178 阅读 · 10 评论 -
ImageNet数据集 & 下载
ImageNet官网:http://image-net.org/ImageNet 由斯坦福李飞飞教授带领创建,ImageNet 本身有2万多个的类别,超过 1400 万张图片,其中超过 100 万张图片有明确类别标注和物体位置标注。ImageNet 按照 WordNet 层级结构组织数据,首先介绍一下 WordNet。在 WordNet 中每一个概念(concept)都会由很多个词(word)或者短语(word phrase)来描述,就好比说 “动物 animal” 作为一个 concept,可以包含 “d原创 2022-07-02 21:36:08 · 9578 阅读 · 2 评论 -
PASCAL VOC2012 & 增强数据集
下面三张分别是原图,实例分割和语义分割的 PNG 图:Benchmark 数据集:benchmark_RELEASE其所有的图片都可用于分割任务(语义分割与实例分割),共 11355 张,其中官方划分用于训练的数据包含 8498 张,用于验证的数据包含 2867 张,如下表: 文件夹下包含了训练数据的相关内容,其中 为语义分割标签, 为实例分割标签, 为原图,其中两种标签都是以 .mat 的格式存储的。(1)img:(2)cls 和 inst:查看 cls 语义分割 中的一个 .mat 文件:原创 2019-06-27 14:09:12 · 9091 阅读 · 25 评论 -
制作VOC数据集标注文件
数据集制作:原图、标签、XML文件的命名均为 0001.* ~ 3371.*,一一对应。(1)生成 XML 文件命名规则 0001.xml,共 3371 个利用师兄的 Json 文件,提取图片宽高信息、bbox 信息,来生成 VOC 数据集需要的 xml 文件。Json 文件中 bounding box 信息坐标原点在左上角,四个值分别为 xmin′xmin'xmin′,ymin′ymi...原创 2020-02-28 18:45:58 · 999 阅读 · 3 评论 -
COCO数据集标注 & 代码
在 COCO 官方数据集里,train 的数据集标注有 6 个 .json 文件,captions 打头的两个是用于 image caption 的,person_keypoints 打头的两个是用于 object keypoint 的,这里我需要的是 image segmentation,所以只说怎么做 instances 的 json 文件啦~ 和 结构是一样的,一个用于训练一个用于测试。都符合下面的大框架:其中:info、license 的结构如下前面两个都没什么影响,主要在于 image,a原创 2020-05-06 23:30:25 · 5263 阅读 · 2 评论 -
踩坑记录
最近被这个眼底数据集搞得很烦躁,各种反人类的骚操作… (其实还是自己不细心,忘了很多处理数据的细节问题,才导致这么多问题)特别记录一下吧,以后长个记性,不然真的会冒黑血…问题一:注意数据集标注方式很多网络都用 VOC 格式的数据,一般组织起来也比较方便,但是用的多的就忘了一个很重要的问题,VOC 是将 255 像素值看作 “ignore label” 的,它是 VOC 数据标注中的描边,是不参...原创 2019-11-22 19:32:59 · 1098 阅读 · 5 评论 -
RETOUCH数据集排行榜
RETOUCH数据集排行榜原创 2020-03-04 13:28:54 · 537 阅读 · 3 评论 -
【眼底图像数据集】视杯 & 视盘分割
https://data.mendeley.com/datasets/rscbjbr9sj/2分类数据: 张彩色眼底图像,格式 ,用于糖尿病视网膜病变检测,用于分类任务。数据标注:Excel 文件,标注了每幅图像的:下载链接:Messidor数据说明:1200 张图片分为 3 组,分别为来自不同眼科部门的数据,各 400 张图像;每组包含 4 个子压缩包,各子压缩包下分别有 100 张图像。数据: 张视网膜图像,是 Messidor 数据的扩展。该数据集有四个任务,分别为:数据: 张彩色视网膜眼底图像,包括原创 2020-03-04 13:08:23 · 5715 阅读 · 8 评论 -
【眼底数据集】RETOUCH & REFUGE & IDRiD
图像数据:分割类别:REFUGE 相关数据:数据前处理:数据后处理:数据描述:数据描述 图:图像数据文件: 和 标签文件: 和 图像大小:(height * width * num * volume), 表示有多种尺寸病灶类别:四个类别比例:按像素个数统计原图与标签Overlap :训练数据划分:RETOUCH 相关数据:论文统计排行榜数据:Grand Challenge 网站排行榜:分割任务:图像数据:病灶类别:四类病灶在训练集(Set A)和测试集(Set B)中的图像个数:图原创 2020-03-04 13:30:17 · 6350 阅读 · 23 评论