2024春季《神经网络与深度学习》第六周学习报告

最新推荐文章于 2024-07-21 07:50:37 发布

weixin_45969911

最新推荐文章于 2024-07-21 07:50:37 发布

阅读量515

点赞数 8

文章标签：深度学习神经网络学习

本文链接：https://blog.csdn.net/weixin_45969911/article/details/138092819

版权

图像识别常用数据集Benchmark

MNIST是由纽约大学创建的手写数字图像数据集，包括 7000 张 28*28 黑白像素的手写数字图像，数字范围是 0～9，按照 6:1 的比例划分训练集和测试集。MNNIST 数据集简单明了，成为了神经网络和机器学习算法评估的基础指标之一，但由于噪声、扭曲和笔迹的差异，识别数字仍然具有挑战性。

CIFAR-10 数据集包括 60000 张 32*32 彩色像素的图像，每 6000 张为一类，按照5:1的比例划分训练集和测试集。CIFAR-10 具有颜色和更精细的细节，使之成为更具挑战性的图像处理任务，并且尺寸相对较小，可以在个人计算机上进行训练。

ImageNet 数据集包括超过 1400 万张标记图像，涵盖超过 20,000 个不同的类别，包括动物、植物、物体、场景、人物和活动。图像主要来自 ImageNet 大型视觉识别挑战（ILSVRC）年度竞赛。

TP：True Positive，正确地被划分为正例的个体，实际为正样本并且被分类器认为是正例。

TN：True Negative，正确地被划分为负例的个体，实际为负样本并且被分类器认为是负例。

FP：False Positive，错误地被划分为正例的个体，实际为负样本但是被分类器认为是正例。

FN：False Negative，错误地被划分为负例的个体，实际为正样本但是被分类器认为是负例。

P-Precision精确率，将实际为正类预测为正类的样本数除以预测为正类的样本总数。

R-Recall召回率，将实际为正类预测为正类的样本数除以实际为正类的样本总数。

PR曲线是一种图像化显示分类器性能的工具，显示了模型在不同阈值下的精确率和召回率。

PR 曲线能提供有关分类器性能的以下信息：

（1）高召回率区域：曲线右上角表示分类器在召回大多数实际正类方面做得很好。

（2）高精确率区域：曲线左上角表示分类器在预测正类时准确性很高。

（3）曲线下面积（AUC-PR）：AUC-PR 是 PR 曲线下的面积，它提供了一个单一指标，表示分类器的整体性能。AUC-PR 的范围从 0 到 1，其中 1 表示完美的分类器。

关注