【深度学习理论】Model的Errors来自哪里?

1. 前言

机器学习的本质是从一个function set中挑选一个最优的function f ∗ f^* f又称为model)来拟合样本(设样本的真实分布为 f ^ \hat{f} f^)。因此,影响 f ∗ f^* f质量的因素为:

  1. function set是否包含 f ^ \hat{f} f^
  2. function set中挑选的 f ∗ f^* f是否能有效的拟合样本;

本文从以上两点分析机器学习中影响model效果的因素。

2. 实验

找到一个模型判断Pokemon当前CP值与进化之后的CP值直接的关系。
现给定三个function set

  1. function set1: y = w ∗ x c p + b y=w*x_{cp}+b y=wxcp+b
  2. function set2: y = w 1 ∗ x c p + w 2 ∗ x c p 2 + w 3 ∗ x c p 3 + b y=w_{1}*x_{cp}+w_2*x_{cp}^2+w_3*x_{cp}^3+b y=w1xcp+w2xcp2+w3xcp3+b
  3. function set3: y = w 1 ∗ x c p + w 2 ∗ x c p 2 + w 3 ∗ x c p 3 + w 4 ∗ x c p 4 + w 5 ∗ x c p 5 + b y=w_{1}*x_{cp}+w_2*x_{cp}^2+w_3*x_{cp}^3+w_4*x_{cp}^4+w_5*x_{cp}^5+b y=w1xcp+w2xcp2+w3xcp3+w4xcp4+w5xcp5+b

由上可知: s e t 1 ⊂ s e t 2 ⊂ s e t 3 set1\sub set2 \sub set3 set1set2set3,即set3囊括的范围最大,set2次之,set1最小。

2.1 Variance

先对三个function set从样本空间中进行100次随机采样训练,得到的效果图如下所示:
在这里插入图片描述
从上图可以看出:function set3选出的 f ∗ f^* f的离散程度(方差,Variance)最大,function set2次之,function set1最小。由此可以得出:模型越复杂,Variance(方差)越大。
在这里插入图片描述

2.2 Bias

假设样本的真实分布 f ^ \hat{f} f^的函数图像如下:
在这里插入图片描述
上述三个function set的均值如下图蓝色线所示:
在这里插入图片描述
从上图可以看出:function set3选出的 f ∗ f^* f均值与 f ^ \hat{f} f^的偏移程度(偏置,Bias)最小,function set2次之,function set1最大。由此可以得出:模型越简单,Bias(偏置)越大。

在这里插入图片描述

3. 分析

3.1 Bias VS Variance

有以上实验可知,Model的效果与VarianceBias有关。
在这里插入图片描述

Modelerror来自与VarianceBias,而VarianceBias又与Model的复杂程度有关。梳理如下:

  1. Model越复杂(function set的范围大),Variance越大,Bias越小;
  2. Model越简单(function set的范围小),Variance越小,Bias越大;
  3. 好的ModelVarianceBias的平衡;

在这里插入图片描述

3.2 Underfitting VS Overfitting

Underfitting(欠拟合)是指:当Modeltraining data set中无法获得好的效果时,此时Model有一个Large Bias。有两种常用的方案可以解决此问题:

  1. 增加更多的features(特征)
  2. 增大Model的复杂程度;
  3. 训练更长的时间;

Overfitting(过拟合)是指:当Modeltraining data set中有很好的效果,但是在testing data set中效果不佳,此时Model有一个Large Variance。有两种常用方案可以解决此问题:
4. 使用更多的数据进行训练;
5. 正则化;
6. Early Stopping;

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值