1. 知识点
- 正交化
算法的部分调整和修改,不会对其他部分产生影响。
- 单一数字评估指标:为模型设置一个单一的数字评估指标
以猫的二分类为例。precision表示预测为猫的图片中,确实为猫的概率。Recall表示真实为猫的图片中,预测为猫的概率。F1是对前两者进行一个运算,F1_Score=2/(1/p+1/r)。
- 满足指标和优化指标
比如,要求模型耗时在1000ms内,预测准确率尽可能高,那么Running_time为满足指标,Accuracy为优化指标。
- 训练集、开发集、测试集
训练集、开发集、测试集和未来实际使用的数据要具有相似性。
训练集、开发集、测试集从所有样本数据中随便划分。
测试集足够大(>10000),能够在过拟合的模型中给出高方差的结果。
开发集只要足够验证不同模型的优劣性即可,在百万大数据取1%大小就足够。、
- 根据实际应用调整指标公式
比如,两个猫的二分类模型,模型A的错误率是3%,模型B的错误率为5%,从指标看模型A更优。但在实际应用中,因为模型A的某些原因,错将一些深颜色的恐怕图片误判为黑色的猫,给用户推送,用户感受很不好。
那么,则调整错误率指标公式,加入权重,将普通误差图片按权重为1计算,将误差图片为恐怕图片按权重100计算。这样模型A的错误率会快速增大。
- 与人类的认识偏差相比较
对于左边,人类认识的误差为1%,训练集偏差为8%,相差较多,训练集偏差有较大的优化空间。
对于右边,人类认识的误差为7.5%,训练集偏差为8%,相当接近,训练集偏差几乎没有了优化空间,模型优化的方向应为减小测试集方差。
- 改善模型
减少可避免的偏差:训练更大的模型、训练更长时间、优化算法(Momentum\RMSprop\Adam)、用更好的网络架构(RNN、CNN)、调整超参数。
减少方差:训练更多的数据、正则化(L2、dropout)、用更好的网络框架(RNN、CNN)、调整超参数