2024春季《神经网络与深度学习》第六周学习报告

图像识别常用数据集Benchmark

MNIST数据集

MNIST是由纽约大学创建的手写数字图像数据集,包括 7000 张 28*28 黑白像素的手写数字图像,数字范围是 0~9,按照 6:1 的比例划分训练集和测试集。MNNIST 数据集简单明了,成为了神经网络和机器学习算法评估的基础指标之一,但由于噪声、扭曲和笔迹的差异,识别数字仍然具有挑战性。

CIFAR 10 数据集

CIFAR-10 数据集包括 60000 张 32*32 彩色像素的图像,每 6000 张为一类,按照5:1的比例划分训练集和测试集。CIFAR-10 具有颜色和更精细的细节,使之成为更具挑战性的图像处理任务,并且尺寸相对较小,可以在个人计算机上进行训练。

ImageNet数据集

ImageNet 数据集包括超过 1400 万张标记图像,涵盖超过 20,000 个不同的类别,包括动物、植物、物体、场景、人物和活动。图像主要来自 ImageNet 大型视觉识别挑战(ILSVRC)年度竞赛。

数据集与评价指标

评价指标

TP:True Positive,正确地被划分为正例的个体,实际为正样本并且被分类器认为是正例。

TN:True Negative,正确地被划分为负例的个体,实际为负样本并且被分类器认为是负例。

FP:False Positive,错误地被划分为正例的个体,实际为负样本但是被分类器认为是正例。

FN:False Negative,错误地被划分为负例的个体,实际为正样本但是被分类器认为是负例。

混淆矩阵

预测=1预测=0
真实=1TPFN
真实=0FPTN

PR曲线

P-Precision精确率,将实际为正类预测为正类的样本数除以预测为正类的样本总数。

R-Recall召回率,将实际为正类预测为正类的样本数除以实际为正类的样本总数。

PR曲线是一种图像化显示分类器性能的工具,显示了模型在不同阈值下的精确率和召回率。

PR 曲线能提供有关分类器性能的以下信息:

(1)高召回率区域:曲线右上角表示分类器在召回大多数实际正类方面做得很好。

(2)高精确率区域:曲线左上角表示分类器在预测正类时准确性很高。

(3)曲线下面积(AUC-PR):AUC-PR 是 PR 曲线下的面积,它提供了一个单一指标,表示分类器的整体性能。AUC-PR 的范围从 0 到 1,其中 1 表示完美的分类器。

  • 8
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值