机器学习任务攻略

机器学习任务攻略

1. 出现误差的原因

1.1 model bias

  • The model is too simple.
  • Solution:redesign your model to make it more flexible.

请添加图片描述

1.2 optimization issue

  • 局部最优解
    在这里插入图片描述从Testing data上来看,56层的表现不如20层,不是过拟合。检查一下训练资料上的结果,20层和56层对比,56层弹性应该比20层的大,但是表现的却不好,不是模型偏差,而是56层的optimization没有处理好 。
  • Gaining the insights from camparison.
  • Start from shallower networks(or other models), which are easier to
    optimize.
  • If deeper networks do not obtain smaller loss on training data, then
    there is optimization issue.
    在这里插入图片描述
    上面数据中,5层的loss比4层的大,是不科学的,因此是optimization的问题。
  • Solution:more powerful optimization technology

1.3 overfitting

small loss on training data, large loss on testing data.
An extreme example
如果x存在于训练集,就输出他的标签,否则输出一个随机数。
在这里插入图片描述
更加灵活的模型会导致过拟合的出现。在这里插入图片描述

解决办法

  • 增加训练资料
  • data augmentation(数据加强)
    根据对数据的理解,增加资料。将图片资料翻转,截取其中一部分。注意不要上下翻转(不符合常理,可能会使机器感到奇怪。)
  • 对模型增加限制,不要让他过于灵活。
    less parameters, sharing parameters.减少参数,如果是深度学习,就减少神经元的个数。
    less features 例如,用前三天的资料预测明天,可以减少为用前两天的资料来预测明天。
    early stopping
    regularization
    dropout

在这里插入图片描述

1.4 mismatch

training and testing data have different distributions.
在这里插入图片描述

2.训练集和测试集的划分

  • 随机
  • N-fold Cross validation
    在这里插入图片描述

训练集:学习样本数据集,通过匹配一些参数建立一个分类器,主要是用来训练模型的。
验证集:对学习出来的模型,调整超参数。
测试集:测试集训练 ,好的模型的准确率

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值