正则化

理解

  • 结构风险最小化方法(基于VC维)
  • 模型选择方法(通过加入先验知识,即偏置,来达到增大模型泛化能力)
  • 可以从贝叶斯角度解释其常用方法

线性回归

  • 参数惩罚
  • shrinkage,岭回归=线性回归+shrinkage

基于树的模型

  • 决策树中剪枝
  • 提升树种的shrinkage

SVM

  • 最大化margin

神经网络

  • CNN中权值共享
  • Weight decay
  • Early Stopping
  • Dropout

网络中的权重倾向于选择取值小的,因为这样可以使权重的变化范围相对小;良好正则化的神经网络倾向于选择参数少的模型,因为这种模型更加符合奥卡姆剃刀原理。关于这点的贝叶斯解释可以参考Theodoridis 2015,chapter 12.3

其他

  • 数据集中加入噪声,其实增加了有效的数据量
  • Early Stopping
    • 当验证集上的验证误差随着训练次数增加而增加时,说明产生了过拟合,所以验证误差最小时的参数应该是Early Stopping策略所返回的模型参数。

参考

神经网络
1.Bengio etc,Deep Learning,2015

Shrinkage
1.Tibshirani R. Regression shrinkage and selection via the lasso[J]. Journal of the Royal Statistical Society. Series B (Methodological), 1996: 267-288.
2.Hoerl A E, Kennard R W. Ridge regression: Biased estimation for nonorthogonal problems[J]. Technometrics, 1970, 12(1): 55-67.

贝叶斯效应函数和奥坎姆剃刀原理
1.Theodoridis S. Machine learning: a Bayesian and optimization perspective[M]. Academic Press, 2015.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值