机器学习笔记8——ERM

这一章开始将学习理论偏差与方差的权衡ERM——经验风险最小化
摘要由CSDN通过智能技术生成

前言:在之前几章中我们已经了解到了很多算法,也知道了在人工智能领域中最强大的机器学习的工具。接下来需要理论结合实际将算法应用到实际问题中。这一笔记我们开始讲学习理论,了解理论知识。

下面开始介绍的第一个学习理论是偏差-方差权衡

当我们讲线性回归时,我们讨论过一个问题:是使用简单的线性假设 y = θ 0 + θ 1 x y = \theta_0 + \theta_1x y=θ0+θ1x来拟合数据还是用更复杂一点的假设 y = θ 0 + θ 1 x + . . . + θ 5 x 5 y = \theta_0 + \theta_1x + ... + \theta_5x^5 y=θ0+θ1x+...+θ5x5来拟合数据呢?

从最右侧的图中可以看到,用五次多项式来拟合数据并不是一个好的模型。尤其是,即使五次多项式对训练样本做出了很好的预测,但我们把并不期待在不基于原有训练集的基础上该假设会有一个良好的预测效果。换句话说,该假设从训练集中习得的结果对其他训练样本并不具有良好的普适性。

这一假设的泛化误差是预期误差,但不必在训练集中存在。

在上述最左侧和最右侧的图都有泛化误差。然而,两种模型出现的问题不同。如果输入特征与输出变量的关系不是线性的,那么即使我们用线性模型去拟合大量的数据集,线性模型仍然不会成功捕获到数据中的结构。

因此,对于上述的问题,线性模型存在较大的偏差,也就是对数据的欠拟合。

除了偏差,泛化误差还有第二个部分,在模型拟合过程中的方差。尤其是当我们最右侧图中的五次多项式,在数据拟合过程中会存在很大的风险。因为在数据集中会偶然得到比平均房价高的数据样本,也会有比平均房价低的数据样本。为了拟合数据集中这些“有欺骗性”的模式,可能会再次出现较大的泛化误差。在这一过拟合过程中,模型有较大的方差

而对于偏差与方差我们会找到一种折中的方案(平衡)。如果我们的模型太过简单有很少的参数,那么这个模型可能会有较大的偏差(较小的方差);相反如果模型太过复杂有很多的参数,那么这个模型可能会有较大的方差(但是较小的误差)。

在上述的问题中,用二次函数来拟合数据比前两者要好很多。

接下来我们将要更深入的理解过拟合与欠拟合,或者说高偏差与高方差。之后将会提出一个更为正式的机器学习模型,并且尝试证明这两个问题何时会出现。


首先考虑线性分类 h θ ( x ) = g ( θ T x ) h_\theta(x) =g( \theta^Tx) hθ(x)=g(θTx) g ( z ) = 1 { z ≥ 0 } g(z) = 1\{z \geq 0\} g(z)=1{ z0},其中 y ∈ { 0 , 1 } y \in \{0,1\} y{ 01}。我们可以将这个模型看作逻辑回归(该模型与逻辑回归非常相似,不同的一点是强制让逻辑回归输出0和1作为类标签)。

所以现在给定一组训练集, S = { ( x ( i ) , y ( i ) ) ; i = 1 , . . . , m } S =\{(x^{(i)},y^{(i)});i = 1,...,m\} S={ (x(i),y(i));i=1,...,m},其中包含m个训练样本。假设每个样本之间是独立同分布的,并且服从某个分布 D D D

为了理解偏差和方差,我们将会使用一个简化的机器学习模型(特别说一下,逻辑回归通过对数似然性来拟合参数)。但为了更深入的理解机器学习算法,我们要定义一个简化版的机器学习的模型。

首先定义一个训练误差/风险

上述公式的含义很明确:被假设错误分类的训练样本之和/总训练样本数 = 被假设错误分类的训练样本所占比例。

我们将要讲的简化版的机器学习模型被称作ERM(经验风险最小化)。

学习算法的目的是选择参数使得训练误差最小化。我们认为ERM算法是最基础的学习算法。(像逻辑回归也可以看作是ERM的近似算法)

对于上述ERM的目的,与其看作是选择参数来使训练误差最小,不如可以等价看作选择一个函数。所以,接下来我们定义一个假设类 H H

  • 14
    点赞
  • 62
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值