机器学习—学习曲线

月亮月亮要去太阳

已于 2023-12-16 13:54:37 修改

阅读量508

点赞数

文章标签：机器学习人工智能

于 2023-10-26 20:55:41 首次发布

本文链接：https://blog.csdn.net/qq_43710593/article/details/134064466

版权

学习曲线的纵坐标

通常表示模型的性能指标，具体的选择取决于具体的问题和任务。常见的性能指标包括：

误差（Error）：用于回归任务的性能指标，常见的包括均方误差（Mean Squared Error, MSE）、平均绝对误差（Mean Absolute Error, MAE）等。
损失（Loss）：用于分类任务或神经网络模型的性能指标，常见的包括交叉熵损失（Cross Entropy Loss）、对数损失（Log Loss）等。
准确度（Accuracy）：用于分类任务的性能指标，表示模型正确分类的比例。
精确度（Precision）：用于二分类任务的性能指标，表示模型正确预测正例的比例。
召回率（Recall）：用于二分类任务的性能指标，表示模型正确预测正例的覆盖率。
F1 分数（F1 Score）：综合考虑精确度和召回率的性能指标，常用于不平衡数据集的分类任务。

根据具体的任务和模型，选择适合的性能指标作为学习曲线的纵坐标。例如，在回归任务中可以使用均方误差作为纵坐标，而在分类任务中可以使用准确度或交叉熵损失作为纵坐标。

训练集曲线（Training curve）：该曲线表示模型在训练集上的性能指标随着训练样本数量变化的情况。通常，训练集曲线会随着模型看到更多的训练样本而逐渐收敛或趋于稳定。初始阶段，训练集上的性能指标可能较低，随着样本数量的增加，模型逐渐学习到数据的模式和特征，导致性能指标逐渐提升。
验证集曲线（Validation curve）：该曲线表示模型在验证集上的性能指标随着训练样本数量变化的情况。验证集曲线用于评估模型在未见过的数据上的泛化能力。通常，验证集曲线会随着模型看到更多的训练样本而逐渐收敛或趋于稳定。高质量的模型应该在验证集上表现良好，而不仅仅是在训练集上。

通过观察训练集曲线和验证集曲线的变化情况，我们可以了解模型在不同训练集样本数量下的表现，并判断模型是否出现欠拟合或过拟合。当训练集曲线和验证集曲线都达到稳定时，模型可能达到了最佳性能，并且可以进一步通过调整超参数或改进模型来提高性能。