【deeplearning.ai】Week8 机器学习模型构建的最佳实践

最新推荐文章于 2021-02-09 22:25:32 发布

KDLin

最新推荐文章于 2021-02-09 22:25:32 发布

阅读量146

点赞数

分类专栏： deeplearning.ai

本文链接：https://blog.csdn.net/CsWarmSun/article/details/97139062

版权

deeplearning.ai 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

实践

摘要

本周主要是在构建机器学习模型的过程中的处理问题的思考方式和构建整个项目内容的思考方式，如dev/test集，策略，算法调整。相对于实践理论，从整体上对项目进行设置和调整的思考方法。

这一门课就是炼丹参考书，出问题来翻阅。

正交思想（Orthogonalization）

这是所有理论的基础，大致上就是那个点出问题就调哪个点的开关，尽可能不要影响到其他东西。即，让处理对象之间正交，这对于巨大的系统是很有意义的。

模型分析

从train/dev/test/real world的表现来调整

数据集合（表现不佳）	处理方式
train set	Bigger network
	Adam等优化算法
dev set	Regulation
	Big train set
test set	Big dev
real world（实际表现）	change dev set
	cost function

这个表格将会贯穿整一周的内容。非常重要，下面讲了之后，可以不时回过头来看看，问问处理方式，是为什么。

Bias、Variance分析

这个主要是train、dev、test出问题的时候的处理方式老容易混淆，搞不清哪跟哪。其实很简单，只要记住，Bias一般出现在train中，一般指训练结果和实际情况的对比，也就是低拟合。Variance出现在其他数据集，指过拟合。

低拟合怎么办？查看表格，一般使用Bigger network能很好提高拟合，Adam等优化算法可以减少振荡，使得在有限迭代次数内尽可能找到最小值，提高拟合。

高拟合怎么办？一般只有两种方式，dev set中表现不好，出现高拟合，那么可以优先考虑Regulation，原因是train set 对于数据的拟合太过了，用Regulation可以降低它的拟合程度。另一种方式是通用的，增大训练数据，因为原来的数据它训练过度，所以dev表现不好，说明train过拟合，增大train的数据，test表现不好，说明dev过拟合，增大dev的数据。