Advice for Applying Machine Learning(Andrew ng ML)

最新推荐文章于 2020-10-14 09:29:26 发布

hello_pig1995

最新推荐文章于 2020-10-14 09:29:26 发布

阅读量528

点赞数

分类专栏：学业文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Zhaohui1995_Yang/article/details/51525663

版权

学业专栏收录该内容

67 篇文章 0 订阅

订阅专栏

Advice for Applying Machine Learning

1.high bias and high variance

high bias即欠拟合，这样的情况下，训练的J收敛比较快，train 和 validation最后都比较相似，增加数据量的大小并没有什么实际意义。

high variance即过拟合，J变化相对比较缓慢，所以增加数据的大小能够小幅度缓解参数的分布，从而能够缓慢的增加准确率，降低J。

一旦J(cross validation)>>J(train data)，这意味着在训练中，可能有一些东西没有学到，增加数据会很有帮助，不过如果是大于一点点，可能就是小问题就是过拟合了吧。。。

2.样本和特征相互拮抗

对于high variance来说，就是说明过拟合，而实际上就说明，feature相对于样本数量过多，那么减少feature或者增加样本都有助于缓解high variance。

对于high bias来说，就是欠拟合，说明，当前所拥有的特征并不足以区分样本们，所以需要更多的特征。当然，减少样本的数量就算了吧。。
增加特征可以通过增加比如说二次方项，三次方项等等方法来实现。

其实可以这么想，在高维空间中分布着一些点们，我需要在其中画一条弯弯曲曲的平面将其区分开，有这么主要三个影响因素：样本数量，特征维度，以及正则化项的大小。
前两个因素共同影响样本分布的密度。
最后一个因素影响曲面的扭曲的强度。lambda越大，曲面越耿直。。
所以如果过拟合了，那么说明，我的曲面非常妖娆，或者说数据太容易区分了。曲面妖娆要增加lambda，而数据太容易区分了说明其分布太稀疏，降低维度，或者增加数据量大小都成！
如果欠拟合，将上面的翻过来理解就成。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。