支持向量机基础 2 ERM原则

最新推荐文章于 2023-12-23 11:25:14 发布

半只兔子M

最新推荐文章于 2023-12-23 11:25:14 发布

阅读量961

点赞数

分类专栏：支持向量机文章标签：机器学习支持向量机

本文链接：https://blog.csdn.net/qq_40525438/article/details/108172920

版权

2 经验风险最小化（ERM）归纳原则

2.1 ERM 原则的一致性

经验风险(empirical risk)泛函：
$R_{emp}(\alpha)=\dfrac{1}{l}\sum\limits_{i=1}^lQ(z_i,\alpha)$
经验风险最小化( Empirical Risk Minimization, ERM )原则即认为使经验风险泛函 $R_{emp}(\alpha)$ 最小的损失函数 $Q$ 也可以使风险泛函 $R(\alpha)$ 达到最小。若将 $Q$ 代入回归模型损失函数，ERM 原则变为最小二乘法，若代入概率密度估计损失函数，ERM 原则则变为最大似然方法。

为确认 ERM 原则的可靠性，我们首先需要对其一致性进行分析。ERM原则一致性和非平凡一致性的定义如下

定义 2.1

对于风险泛函 $R(\alpha)$ 和经验风险 $R_{emp}(\alpha)$ 若
$R(\alpha_l) \xrightarrow[l \rightarrow \infty]{p} \inf\limits_{\alpha \in \Lambda} R(\alpha) \space and \space R_{emp}(\alpha_l) \xrightarrow[l \rightarrow \infty]{p} \inf\limits_{\alpha \in \Lambda} R(\alpha)$
则称ERM原则对 $\alpha), \alpha \in \Lambda, F(z)$ 是一致的。

定义 2.2

设
$\Lambda (c) = \{\alpha: \int Q(z, \alpha)dF(z) > c, \alpha \in \Lambda \}$
若
$\inf\limits_{\alpha \in \Lambda (c)} R_{emp} (\alpha) \xrightarrow[l \rightarrow \infty]{P} \inf\limits_{\alpha \in \Lambda (c)} R(\alpha), \forall \Lambda(c) \not = \varnothing$
称 ERM 原则对 $\alpha), \alpha \in \Lambda, F(z)$ 是非平凡一致的。这是为了排除函数集 $\alpha)$ 中包含一个对任意 $z$ 均为最小的函数从而平凡地满足原定义的情况。

ERM 一致单边收敛的条件如下定理所述。

定理 2.1

(1989, Vapnik and Chervonenkis) 设函数集 $\alpha)$ 满足条件 $\le R(\alpha) \le B$ 那么 ERM 原则一致性的充要条件为：
$\lim\limits_{l \rightarrow \infty} P\{ \sup\limits_{\alpha \in \Lambda} (R(\alpha) - R_{emp}(\alpha)) > \epsilon \} = 0, \forall \epsilon > 0$
称这种一致收敛为一致单边收敛。

显然在定理2.1条件下有一致双边收敛充要条件:
$\lim\limits_{l \rightarrow \infty} P\{ \sup\limits_{\alpha \in \Lambda} |R(\alpha) - R_{emp}(\alpha)| > \epsilon \} = 0, \forall \epsilon > 0$
我们希望找到上式（类似于大数定理）的等价条件。在此之前，我们先引入随机熵、熵、随机 VC 熵、VC 熵的概念。

考虑模式识别问题，设 $\alpha), \alpha \in \Lambda$ 为一个指示函数集，考虑样本 $z_i )$ ，定义 $N^\Lambda (z_1,...,z_l)$

最低0.47元/天解锁文章

半只兔子M

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
支持向量机基础 2 ERM原则

2 经验风险最小化（ERM）归纳原则2.1 ERM 原则的一致性经验风险(empirical risk)泛函：Remp(α)=1l∑i=1lQ(zi,α)R_{emp}(\alpha)=\dfrac{1}{l}\sum\limits_{i=1}^lQ(z_i,\alpha)Remp(α)=l1i=1∑lQ(zi,α)经验风险最小化( Empirical Risk Minimization, ERM )原则即认为使经验风险泛函 Remp(α)R_{emp}(\alpha)Remp(α) 最小
复制链接

扫一扫