小样本数据集介绍

本篇对小样本学习常用数据集进行介绍,由于本人理解问题,可能还存在误差。

1、Omniglot

Omniglot 数据集包含来自 50 个不同字母的 1623 个不同手写字符。每一个字符都是由 20 个不同的人通过亚马逊的 Mechanical Turk 在线绘制的。

相当于1623个类,每类20个样本。对于one shot来说,support_num_per_class = 1,query_num_per_class = 19。

每个图像都与笔画数据配对, 坐标序列为 [x, y, t][x,y,t], 且时间 (t)(t) 以毫秒为单位。笔画数据仅在 matlab/ 文件中可用。

数据集的引用: Lake, B. M., Salakhutdinov, R., and Tenenbaum, J. B. (2015). Human-level concept learning through probabilistic program induction. Science, 350(6266), 1332-1338.

Omniglot 数据集总共包含 50 个字母。我们通常将这些分成一组包含 30个字母的背景(background)集和一组包含 20 个字母的评估(evaluation)集。

更具挑战性的表示学习任务是使用较小的背景集 “background small 1” 和 “background small 2”。每一个都只包含 5 个字母, 更类似于一个成年人在学习一般的字符时可能遇到的经验。

参考文献:http://www.imooc.com/article/details/id/258879

数据集可到这里下载,也可用下面代码下载。

#!/usr/bin/env bash
DATADIR=data/omniglot/data
 
mkdir -p $DATADIR
wget -O images_background.zip https://github.com/brendenlake/omniglot/blob/master/python/images_background.zip?raw=true
wget -O images_evaluation.zip https://github.com/brendenlake/omniglot/blob/master/python/images_evaluation.zip?raw=true
unzip images_background.zip -d $DATADIR
unzip images_evaluation.zip -d $DATADIR
mv $DATADIR/images_background/* $DATADIR/
mv $DATADIR/images_evaluation/* $DATADIR/
rmdir $DATADIR/images_background
rmdir $DATADIR/images_evaluation

2、miniImagenet

miniImagenet取自ImageNet中,包含100个类别,每个类别中包含600个样本数据。其中64个类别数据作为训练集,16个类别数据作为验证集,20个类别数据作为测试集。由于类别较少,一般只做5 way的,不做20way的。
其中原型网络方法分别使用30-way的episode对1-shot类和20-way的episode对5-shot的样本数据进行训练。在训练和测试时保持shot数目一致,query查询点的个数为每个类别15个。

参考文献:http://www.pianshen.com/article/8827150280/

数据集可到这里下载。(还没加超链接,我当时估计直接是把师兄们的复制过来了,现在没去网上找,之后再补)

3、CUB

CUB一般用于zero shot。

CUB数据集包含训练集包含100个类别,验证集包含50个类别,测试集包含50个类别。对于312维度的元向量,模型对鸟类的种类、颜色、羽毛等属性进行编码得到。

其中原型网络方法训练episode的类别为50,每个类别的查询点为10个。

参考文献:https://blog.csdn.net/m0_38031488/article/details/85274890

数据集可到这里下载。(还没加超链接。之后再补)

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值