为什么要有模型调优步骤
比如说我们针对某一个数据集选用了线性回归或者逻辑回归,又或者是神经网络等等的其中一种算法,训练好了一个模型,但是在用测试集数据进行测试的时候,我们的模型表现的并不是很好。那么此时,我们应该做什么?
是直接更换一种模型?
是尝试更多的训练样本?
是减少更多的特征?
还是加入更多的特征?
我们想到了很多的方法对模型进行调试,或者是更换模型,那么选择哪一种方式呢?
在众多的方式中最快捷的选出最有效的一种调优方式,是一个优秀程序员能力的体现。所以,我们需要知道,模型调优的步骤。
机器学习诊断法
我们再遇到上述的,模型在测试集表现不佳的情况下,不应该盲目的随机选择一种调优方式去做,有可能适得其反,并且浪费时间。
我们运用机器学习诊断法来帮助诊断模型到底是出了什么样的问题,然后对模型做出有针对的调优。
诊断法
诊断法其实就是一种测试方法,通过执行这种测试,能够深入了解我们现在所选择算法而建立起来的模型,是否对于这份数据集是有用的。通常,也能告诉我们,想要对这一模型进行调优,什么样的尝试,才是有意义的。
诊断偏差和方差
当我们训练好的模型在测试集表现的不好的时候,多半分为两种情况:要么是偏差比较大,要么是方差比较大。偏差指的是我们的测试集数据中,真实值和预测值之间的差距,差距越大,偏差越大,也就是我们在拟合模型中的欠拟合问题;