名称 | 训练集 | 测试集 | 说明 | |
MNIST手写体数据集 | 60000张 | 10000张 | 10个类别,每张图片28*28 | 单标签、多分类 |
IMDB电影评论数据集 | 25000条评论 50%正 50%负 | 25000条评论 50%正 50%负 | 二分类 | |
路透社数据集 | 8982个样本 | 2246个样本 | 46个不同的新闻主题,训练集中每个主题都有至少10个样本 每个样本都是一个整数列表 | 单标签、多分类 |
波士顿房价数据集 | 404条 | 102条 | 506条样本,每个样本有13个特征,特征的取值范围可能不一样 | 回归 |
猫狗图像数据集 2013年kaggle比赛 | 自定义 | 自定义 | 12500张猫 12500张狗 | CNN |
ImageNet数据集 | 140万张标记图像, 1000个不同种类,包含许多动物类别,其中包含不同种类的猫和狗 | CNN | ||
Glove词嵌入 400000个单词的100维嵌入向量 | LSTM、RNN | |||
耶拿天气数据集 | 每10分钟记录14个不同的量(比如气温、气压、湿度、风向等) | LSTM 温度预测 | ||
CelebA名人人脸数据集 | 超过20万张名人肖像 | VAE | ||
CIFAR10数据集 | 50000张32*32的RGB图像,有10个类别,每个类别5000张图像 | GAN |
转载于:https://www.cnblogs.com/nxf-rabbit75/p/10137219.html