模型优化策略及评估方法

KangKang——

已于 2024-06-11 14:10:15 修改

阅读量793

点赞数 8

分类专栏：吴恩达深度学习笔记文章标签：人工智能

于 2024-06-11 11:28:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51263060/article/details/139586701

版权

吴恩达深度学习笔记专栏收录该内容

13 篇文章

订阅专栏

一、机器学习策略（ML策略）

1.模型优化的方面

2.正交化

1.正交化

原理：建立一个监督学习系统，需要调节系统的按钮是正交化的，在调节某个参数或某一问题时，尽量较少对其他参数或问题的影响。

2.四个目标

模型在训练集、开发集、测试集和现实世界运行上的效果都要好。

（1）如果算法在成本函数上不能很好的拟合训练集

可以训练更大的神经网络
选择更好的优化算法（Adam算法等）

（2）算法对开发集的拟合效果很差

对算法使用正则化方法（L2正则化、Dro正则化等）
增大训练集，帮助算法归纳开发集更好的规律

（3）在测试集上拟合效果不好

更大的开发集

（4）如果在现实环境上运行效果不好

改变开发集大小
改变成本函数

二、模型的评估方法

1.单实数评估指标

1. F1 Score

假设有两种算法A和B分别对猫咪照片进行分类，效果如下：

Precision:表示样本被分类为猫所占的百分比

Recall:表示在所有真猫的样本中，分类器识别的正确样本所占百分比

F1 Score :综合考虑到了Precision和Recall , $F1 Score = \frac{2}{\frac{1}{Precision} + \frac{1}{Recall}}$

通过设置单实数评估指标F1 Score，可以使得我们很容易评价出哪个算法更好一些。

2.平均值

假设六个算法A~F分别在不同地区的猫咪照片进行分类，分类效果如下：

采用不同地区分类误差率平均值作为单实数评估指标，找出错误率最低的算法，为最好的算法。

2.满足指标和优化指标

假设模型的评估指标有两种，准确率Accuracy和单个图片处理时间Running time:

此时再利用两种指标寻找单实数评估指标变得困难，因此可以将评估指标分类两类，满足指标和优化指标。

我们可以通过以下的方法，选取出最优模型：

Accuracy设置为优化指标，尽可能越大越好。

Running time 为满足指标，规定需要小于100ms。

因此，针对于模型的多个评估指标，我们可以将优化指标综合成一个优化指标，即设置单实数评估指标。然后为满足指标设置门槛，最后变成一个优化指标和多个满足指标的情况，更加便于调试或找出最优模型。

三、训练集、开发集和测试集的划分

1.保持同一分布

注意在划分训练集时，需要保证开发集和测试集来自同一分布，即把数据集随机打乱后再划分。

2.常用划分比例

（1）常规模的数据集，如百、千、万级别

train训练集：test测试集(其实为开发集dev） = 7 : 3

train训练集：开发集dev : 测试集test = 6 : 2 : 2

（2）大规模数据集，如百万级别

train训练集：开发集dev : 测试集test = 98 : 1 : 1

四、贝叶斯最优错误率（Bays error）

贝叶斯最优错误率：从x映射到y的理论最优函数，不可能有比其还低的错误率。

通常人类水平表现已经达到很低的错误率，当超过人类水平表现再向贝叶斯最优错误率优化时，此时可优化的空间已经变得很小了，两者差距不大。

五、可避免偏差和方差

1.定义

人类水平表现与贝叶斯最优错误率差距不大，后者是理论上的最好情况，因此我们通常人类水平表现把人类水平表现近似为贝叶斯最优错误率。

可避免误差:训练集误差率和人类水平表现之间的差距。

方差：开发集误差率和训练集误差率之间的差距。

通常在优化模型时，比较可避免误差和方差的大小，比较两者的优化空间，优先选择更大的优化。

2.减少可避免误差和方差的方法

博客等级

码龄5年

15
原创

237
点赞

303
收藏

179
粉丝

关注

私信

热门文章

分类专栏

最新评论

解决惠普Win10电脑没有wifi图标、网络适配器中无线网卡显示黄色感叹号
摘星X揽月: 20年买的惠普，今天遇到这个问题，楼主的方法确实有效！
机器学习基础知识
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Logistic回归:一种有监督学习的二元分类模型
CSDN-Ada助手: 非常棒的博文！你对Logistic回归的解释清晰明了，让人受益匪浅。希望你能继续分享更多关于监督学习和分类模型的知识。此外，如果你想深入了解模型评估和调参的话题，或讨论特征工程的重要性，可能会对你的学习和实践有所帮助。期待看到你更多的精彩内容！继续加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Logistic回归:一种有监督学习的二元分类模型
CSDN-Ada助手: 非常精彩的博文！通过对Logistic回归的深入解析，我对这种有监督学习的二元分类模型有了更清晰的认识。不过除了梯度下降法和成本函数的相关知识外，你可能也会对特征工程、模型评估指标、模型调参等内容感兴趣。这些都是在实际应用中非常重要的扩展知识和技能，相信你掌握后会更加游刃有余地运用Logistic回归模型。期待你更多的创作，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。