过拟合问题的解决方法

参考:

机器学习中用来防止过拟合的方法有哪些?https://www.zhihu.com/question/59201590

深度学习—过拟合问题

https://www.cnblogs.com/eilearn/p/9203186.html
  
  
  

1 问题:过拟合

2 原因:特征维度过多,模型假设过于复杂,参数过多,训练数据过少,噪声过多

             机器学习算法为了满足尽可能复杂的任务,其模型的拟合能力一般远远高于问题复杂度

3 方法:

  1.  获取更多数据
    1. 从数据源头获取更多数据
    2. 根据当前数据集估计数据分布参数,使用该分布产生更多数据:这个一般不用,因为估计分布参数的过程也会代入抽样误差。
    3. 数据增强(Data Augmentation):通过一定规则扩充数据
  2. 使用合适的模型
    1. 通过使用合适复杂度的模型来防止过拟合问题,让其足够拟合真正的规则,同时又不至于拟合太多抽样误差
    2. 四个方面来限制网络能力
      1. 2.1 网络结构 Architecture  这个很好理解,减少网络的层数、神经元个数等均可以限制网络的拟合能力;
      2. 2.2 训练时间 Early stopping

        对于每个神经元而言,其激活函数在不同区间的性能是不同的:这个很好理解,减少网络的层数、神经元个数等均可以限制网络的拟合能力;

      3. 2.3 限制权值 Weight-decay,也叫正则化(regularization)     这类方法直接将权值的大小加入到 Cost 里,在训练的时候限制权值变大

      4. 2.4 增加噪声 Noise   在输入中加噪声:在权值上加噪声对网络的响应加噪声

    3. 3. 结合多种模型  训练多个模型,以每个模型的平均输出作为结果

      1. Bagging  分段函数

      2. Boosting   训练复杂神经网络比较慢,那我们就可以只使用简单的神经网络(层数、神经元数限制等)。通过训练一系列简单的神经网络,加权平均其输出

      3. Dropout

        这是一个很高效的方法

    4. 贝叶斯方法

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值