Machine Learning|吴恩达（6）应用机器学习的建议

最新推荐文章于 2021-07-30 11:48:45 发布

路飞在福州

最新推荐文章于 2021-07-30 11:48:45 发布

阅读量199

点赞数

分类专栏：机器学习 matlab

本文链接：https://blog.csdn.net/weixin_40920228/article/details/80699110

版权

12 篇文章 0 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

train数据集：用来训练模型
cross validation数据集：用来测试确认，上一步训练的模型的超参数设定的好坏。并选择最佳超参数。
test 数据集：检验上两步所确定的模型与超参数的预测能力，泛化性。
超参数定义：参数时可以通过自动学习出来的变量，而超参数是无法让模型自行完成学习的。包含这些：学习率（learning）、迭代次数(iteration)、神经网络的网络层数、神经元个数(Number of neurons in the layer)、线性回归中的多项式的次方数(polynome degree)、正则化惩罚参数 $\lambda$ 等等。

这里写图片描述

这里写图片描述
如上图：高偏差的情况下，更多的训练样本将没有什么帮助。

这里写图片描述
如上图：高方差的情况下，更多的训练样本能提升模型的泛化性。

高偏差问题：1）增加特征，如{‘ $x^2,x^3,x_1^2\cdot x_2^2$ etc.’} 2）增加多项式特征 3）减少λ

高方差问题：1）减少特征数量 2）增加训练样本 3）增加λ

关注