吴恩达深度学习笔记整理（七）

最新推荐文章于 2024-06-12 11:22:03 发布

梦想的小鱼

最新推荐文章于 2024-06-12 11:22:03 发布

阅读量112

点赞数

分类专栏：机器学习文章标签：人工智能机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/snajdansa/article/details/132132283

版权

机器学习专栏收录该内容

13 篇文章 2 订阅

订阅专栏

结构化机器学习项目——机器学习策略

目录

结构化机器学习项目——机器学习策略

为什么是ML策略？

单一数字评估指标

满足和优化指标

训练/开发/测试集划分

开发集和测试集的大小

什么时候该改变开发/测试集和指标

为什么是人的表现

可避免偏差

理解人的表现

超过人的表现

改善模型表现

为什么是ML策略？

对于神经网络的训练，我们希望能够总结出一定的规律，能快速有效地提升模型本身的性能，减少试错成本。

正交化

将神经网络各个部分拆解，设置相应的按钮能够快速调节各个部分，来达到高效训练的目的。

单一数字评估指标

查准率precision：在分类器标记为猫的结果里，有多少是真猫

查全率recall：对于所有真猫的图片，正确分辨出来多少

如何更好地结合查准率和查全率

使用调和平均进行加权，F=2/(1/P+1/R)

满足和优化指标

如果要考虑N个指标怎么处理

1.使用加权组合

2.区分满足指标和优化指标，

训练/开发/测试集划分

设立开发集和测试集，需要考虑到最终的目标，以最终目标为导向进行设定。

开发集和测试集的大小

总体大小在五位数，可以按照训练:开发:测试=6:2:2进行划分

百万级别的数据，可以按照训练:开发:测试=98:1:1进行划分

什么时候该改变开发/测试集和指标

评估指标无法很好评估算法：通过加权改变。

开发集分辨率高，图像清晰；实际应用存在遮挡、像素低等问题：修改数据集，使其复合真实场景

定义目标、逼近目标

为什么是人的表现

把机器学习和人进行类比，让机器对人进行模仿

贝叶斯Bayesian最优错误率：理论上可能达到的最优错误率，人在一些任务上已经接近贝叶斯最优错误率

可避免偏差

在训练过程中，我们只希望接近贝叶斯最优错误率，而不是比它更好，因为这样容易过拟合

可避免偏差：训练的准确率和实际人判断的准确率之间的误差

理解人的表现

人类的水平错误可以有不一样的定义，这样，贝叶斯最优错误率不是固定的。

在接近人的水平时，更难分辨出问题时偏差还是方差。所以，机器学习项目的进展在已经做的很好的情况下，很难更进一步

方差：训练错误率和开发错误率之间的差值，你的算法是否能够从训练集泛化推广到开发集。

超过人的表现

当机器的表现超过人的时候，缺失改进的方向，但依靠强大的算力，机器能从海量的数据中发现更多的规律，从而在一些任务上超越人的感知

改善模型表现

目的：1.对训练集拟合的很好。2.能够在开发集和测试集上取得很好的表现

减小可避免误差：大模型、更好的优化算法、更好的神经网络架构

梦想的小鱼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
吴恩达深度学习笔记整理（七）

吴恩达深度学习笔记整理（七）— 机器学习策略
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

梦想的小鱼 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。