深度学习论文中常用指标与图表

哈木卡姆

已于 2024-12-23 15:38:41 修改

阅读量1.2k

点赞数 21

文章标签：深度学习

于 2024-12-23 15:21:06 首次发布

本文链接：https://blog.csdn.net/m0_54740856/article/details/144666779

版权

一、深度学习论文中常用的指标

在深度学习任务中，常用的评估指标主要分为分类性能指标、回归性能指标、模型效率指标和数据集评估相关指标。以下是常用的深度学习算法指标分类和解释：

这些指标用于评估分类模型在步态识别中的表现。

核心指标

准确率（Accuracy）
$\text{Accuracy} = \frac{\text{Number of Correct Predictions}}{\text{Total Number of Predictions}}$
- 适合类别分布均衡的任务。
- 对类别不平衡的数据可能具有误导性。
精确率（Precision）
$\text{Precision} = \frac{\text{True Positives (TP)}}{\text{True Positives (TP)} + \text{False Positives (FP)}}$
- 关注正类预测的准确性。
- 对于错误分类惩罚较高的任务（如步态异常检测）尤为重要。
召回率（Recall）
$\text{Recall} = \frac{\text{True Positives (TP)}}{\text{True Positives (TP)} + \text{False Negatives (FN)}}$
- 关注模型对正样本的覆盖率。
F1-Score

$\text{F1} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$
- 精确率和召回率的调和平均值，适合类别分布不均衡的任务。
混淆矩阵（Confusion Matrix）
- 提供每个类别的预测结果，可视化分类错误的分布情况。

其他指标

分类错误率：
$\text{Accuracy}。$
ROC曲线与AUC值：

用于评估模型区分正负样本的能力，AUC值越接近1，模型性能越好。
多类分类宏平均/微平均（Macro/Micro Average）：

宏平均（Macro Average）：对所有类别单独计算指标的平均值，适合评估每个类别的重要性相同的任务。

微平均（Micro Average）：对所有类别的总TP、FP和FN计算整体指标，适合类别样本不平衡的任务。

均方误差（Mean Squared Error, MSE）
$\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$
- 对预测误差的平方进行平均，强调较大的误差。
均绝对误差（Mean Absolute Error, MAE）
$\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$
- 计算误差的绝对值，适合对较大误差敏感度较低的任务。
R平方（R² Score）
$R^2 = 1 - \frac{\sum (y_i - \hat{y}_i)^2}{\sum (y_i - \bar{y})^2}$
- 反映模型对数据的拟合优度，越接近1说明模型越优秀。

这些指标用于评估模型的实际应用价值。

如果深度学习任务中涉及不同的采样方式或数据增强方法，可以使用以下指标：

用于可视化模型性能、训练过程、数据分布及分析结果。这些图表可以分为数据分析图、训练过程图、模型性能图、模型对比图、特征和可解释性图、其他补充图表。以下是常见类型及用途：

这些图表帮助展示数据集的分布、特征和处理方式。

类别分布柱状图
- 展示数据集中每个类别的样本数量分布，观察类别是否平衡。
- 适用场景：分类任务。
- 工具：matplotlib、seaborn。
特征分布直方图
- 显示输入特征（如步态特征值）的分布形态。
- 适用场景：分析特征是否需要归一化或标准化。
特征相关性热图（Heatmap）
- 计算特征之间的相关性矩阵，用于判断特征冗余或多重共线性问题。
- 工具：seaborn.heatmap()。
数据增强可视化
- 展示数据增强前后样本的对比，验证数据增强的有效性。
时间序列数据可视化
- 对时间步态数据的不同传感器特征进行时序绘图。

这些图表展示模型训练的动态变化过程，是论文中最常见的图。

这些图表用于对比模型预测结果与实际情况。

混淆矩阵（Confusion Matrix）
- 展示分类任务中各类预测的正确与错误分布。
- 工具：scikit-learn.metrics.plot_confusion_matrix。
ROC曲线和AUC值（Receiver Operating Characteristic Curve）
- 横轴为假阳性率（FPR），纵轴为真阳性率（TPR），曲线下面积（AUC）衡量模型区分能力。
- 工具：scikit-learn。
PR曲线（Precision-Recall Curve）
- 适用于类别不平衡问题，横轴为召回率，纵轴为精确率。
Top-k准确率对比图
- 展示不同k值下模型的准确率变化，常用于多类别分类。
预测结果可视化图
- 将模型预测结果与真实标签对比，例如步态识别中的步态轨迹图或传感器时序图。
误差分布图
- 显示分类或回归任务中预测值与真实值的误差分布。