机器学习 day10应用机器学习的建议

最新推荐文章于 2024-07-25 13:44:23 发布

念～旭

最新推荐文章于 2024-07-25 13:44:23 发布

阅读量85

点赞数

分类专栏：吴恩达机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_44290742/article/details/118858999

版权

吴恩达机器学习专栏收录该内容

20 篇文章 2 订阅

订阅专栏

01 决定下一步做什么

开发一个机器学习系统，或者想试着改进一个机器学习系统的性能，应如何决定选择哪条路。不要随意选择。

在这里插入图片描述

机器学习诊断法能够提前发现某些方法是无效的。

在这里插入图片描述

02 评估假设

将所有数据分为训练集和测试集，最经典的分割方法就是按照7:3的比例。

在这里插入图片描述

线性回归算法和平方误差标准学习和测试学习算法，从训练集学习获得参数，在将参数带入测试集得到测试误差。

在这里插入图片描述

训练和测试逻辑回归的步骤及用错误分类（0/1分类错误）来定义测试误差。0/1表示了你预测的分类是正确或错误的情况。

在这里插入图片描述

03 模型选择和训练、验证、测试集

模型选择问题（想要确定对于一个数据集最合适的多项式次数，怎样选用正确的特征来构造学习算法或者假如你需要选择学习算法中的正则化参数）
模型选择问题：用不同的模型拟合数据集得到参数，接着对所有这些模型求出测试集误差，然后根据哪个模型有最小的测试误差来选择使用哪个模型。

在这里插入图片描述

为了解决模型选择出现的问题，我们通常会采用如下的方法来评估一个假设。我们把数据分为三个部分，分别是训练集、验证集、测试集。分配比例分别是6:2:2。

在这里插入图片描述

定义训练误差、交叉验证误差和测试误差

在这里插入图片描述

用验证集选择模型而不是原来的测试集。省下来的测试集可以用它来衡量或者估算算法选择出的模型的泛化误差了。

在这里插入图片描述

04 诊断偏差与方差

如果一个算法表现得不理想，要么是偏差比较大，要么是方差比较大。换句话说要么欠拟合要么过拟合。

训练误差随着我们增大多项式的次数而减小；随着我们增大多项式的次数，我们对训练集拟合的也就越好。对于验证误差来说，如果d为1，会有较大误差；如果d为中等次数大小，能够更好的拟合；当d为4时，也就可能过拟合。

在这里插入图片描述

对于验证误差来说，左边这一端对应的就是高偏差问题；右边这一端对应的就是高方差问题。如果训练误差很小，并且验证误差远大于训练误差说明出现过拟合问题（高方差）。如果是高偏差，则训练误差和验证误差都很大。

在这里插入图片描述

05 正则化和偏差、方差

第一个图是高偏差，欠拟合；中间正合适；最后一个图是高方差，过拟合。

在这里插入图片描述

我们对训练、验证、测试误差的定义都是平均的误差平方和，或者是不使用正则化项时，训练集、验证集和测试集的平均的误差平方和的一半。

在这里插入图片描述

自动选择正则化参数的方法：首先选取一系列想要试用的步长，通常来说步长设为2倍速增长，直到一个比较大的值。这样就选取了12个对应的正则化参数。然后对这12个模型分别最小化代价函数，得到完全不同的参数向量。可以把这些模型用不同的正则化参数来进行拟合，然后我们可以用验证集来评价这些参数sita在验证集上的平均的误差平方和，最终选择误差最小的模型。

在这里插入图片描述

当我们改变正则化参数时，我们的假设在训练集和验证集上的表现（对应本节第一个图）

在这里插入图片描述

06 学习曲线

学习曲线可以判断某一学习算法是否处于偏差或者方差问题，还是二者都有。

当训练集个数很少的时候，能够十分完美的拟合数据，训练集误差基本为0，但是随着训练集越来越多，训练集误差也就会越来越大，逐渐趋于水平。而验证集误差，随着训练集的个数增加而减小，最终趋于水平。

在这里插入图片描述

在高偏差的情况下，训练集误差和验证集误差最终将十分接近，再增加训练集数量将毫无意义。

在这里插入图片描述

在高方差的情况下，总体来说随着训练集数量的增多，训练集误差将会增加，但是增加的很小。而验证集误差一直都比较高，虽然会有所下降，但是不多。所以增加训练集数量还是很有用的。

在这里插入图片描述

07 决定接下来做什么

接下来回到第一节的第一个图，1和2和6对应着高方差的情况，3和4和5对应高偏差的情况（个人理解：高方差就是在多项式的形式下出现的，高偏差就是在项数少的情况下出现的）。

在这里插入图片描述

小型神经网络计算量少，大型神经网络比较容易出现过拟合问题（但是可以用正则化来进行解决），相对来说大型神经网络性能更好。
还有就是选择隐含层层数的问题，可以将数据分为训练集、验证集还有测试集。用训练集分别训练一层、两层、三层的隐含层，最终用验证集来测试，选出合适的层数。

在这里插入图片描述

念～旭

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习 day10应用机器学习的建议

01 决定下一步做什么开发一个机器学习系统，或者想试着改进一个机器学习系统的性能，应如何决定选择哪条路。不要随意选择。机器学习诊断法能够提前发现某些方法是无效的。02 评估假设将所有数据分为训练集和测试集，最经典的分割方法就是按照7:3的比例。线性回归算法和平方误差标准学习和测试学习算法，从训练集学习获得参数，在将参数带入测试集得到测试误差。训练和测试逻辑回归的步骤及用错误分类（0/1分类错误）来定义测试误差。0/1表示了你预测的分类是正确或错误的情况。03 模型
复制链接

扫一扫

专栏目录