图像识别常用数据集Benchmark
MNIST数据集
MNIST是由纽约大学创建的手写数字图像数据集,包括 7000 张 28*28 黑白像素的手写数字图像,数字范围是 0~9,按照 6:1 的比例划分训练集和测试集。MNNIST 数据集简单明了,成为了神经网络和机器学习算法评估的基础指标之一,但由于噪声、扭曲和笔迹的差异,识别数字仍然具有挑战性。
CIFAR 10 数据集
CIFAR-10 数据集包括 60000 张 32*32 彩色像素的图像,每 6000 张为一类,按照5:1的比例划分训练集和测试集。CIFAR-10 具有颜色和更精细的细节,使之成为更具挑战性的图像处理任务,并且尺寸相对较小,可以在个人计算机上进行训练。
ImageNet数据集
ImageNet 数据集包括超过 1400 万张标记图像,涵盖超过 20,000 个不同的类别,包括动物、植物、物体、场景、人物和活动。图像主要来自 ImageNet 大型视觉识别挑战(ILSVRC)年度竞赛。
数据集与评价指标
评价指标
TP:True Positive,正确地被划分为正例的个体,实际为正样本并且被分类器认为是正例。
TN:True Negative,正确地被划分为负例的个体,实际为负样本并且被分类器认为是负例。
FP:False Positive,错误地被划分为正例的个体,实际为负样本但是被分类器认为是正例。
FN:False Negative,错误地被划分为负例的个体,实际为正样本但是被分类器认为是负例。
混淆矩阵
预测=1 | 预测=0 | |
真实=1 | TP | FN |
真实=0 | FP | TN |
PR曲线
P-Precision精确率,将实际为正类预测为正类的样本数除以预测为正类的样本总数。
R-Recall召回率,将实际为正类预测为正类的样本数除以实际为正类的样本总数。
PR曲线是一种图像化显示分类器性能的工具,显示了模型在不同阈值下的精确率和召回率。
PR 曲线能提供有关分类器性能的以下信息:
(1)高召回率区域:曲线右上角表示分类器在召回大多数实际正类方面做得很好。
(2)高精确率区域:曲线左上角表示分类器在预测正类时准确性很高。
(3)曲线下面积(AUC-PR):AUC-PR 是 PR 曲线下的面积,它提供了一个单一指标,表示分类器的整体性能。AUC-PR 的范围从 0 到 1,其中 1 表示完美的分类器。