ESL2.4 统计判别理论学习笔记（含MSE和泛化误差详解）

最新推荐文章于 2020-12-09 21:27:29 发布

Nstar-LDS

最新推荐文章于 2020-12-09 21:27:29 发布

阅读量1.1k

点赞数 3

分类专栏： ESL阅读笔记文章标签：统计学概率论线性代数

本文链接：https://blog.csdn.net/nstarLDS/article/details/104086202

版权

这篇博客是关于《统计学习基础》中2.4节的学习笔记，重点介绍了统计判别理论，特别是平方误差损失（MSE）和泛化误差的概念。博主通过翻译原文和个人解读探讨了平方误差损失在预测模型中的应用，如回归函数和条件期望，并讨论了k-最近邻方法和线性回归如何适应这个框架。此外，还提到了0-1损失函数在分类问题中的使用，以及贝叶斯分类器的基本思想。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2.4 统计判别理论

这是一篇有关《统计学习基础》，原书名The Elements of Statistical Learning的学习笔记，该书学习难度较高，有很棒的学者将其翻译成中文并放在自己的个人网站上，翻译质量非常高，本博客中有关翻译的内容都是出自该学者的网页，个人解读部分才是自己经过查阅资料和其他学者的学习笔记，结合个人理解总结成的原创内容。
有关ESL更多的学习笔记的markdown文件，可在作者GitHub上查看下载。

原文	The Elements of Statistical Learning
翻译	szcf-weiya
时间	2018-08-21
解读	Hytn Chen
更新	2020-01-07

翻译原文

这一节我们讨论一小部分理论，这些理论提供构建模型的一个框架，比如我们目前为止所有非正式讨论的模型．我们首先考虑定量输出时的情形，而且从随机变量和概率空间的角度来考虑．记 $X\in \rm{IR}^p$ 为实值随机输入向量， $Y\in \rm{IR}$ 为实值随机输出变量，联合概率分布为 $\Pr(X,Y)$ ．给定输入 $X$ ，我们寻找一个函数 $f (X)$ 来预测 $Y$ ．这个理论需要一个 损失函数 (loss function) $L (Y, f (X))$ 用来惩罚预测中的错误，到目前为止最常用并且最方便的是 平方误差损失 (squared error loss): $L(Y,f(X))=(Y-f(X))^2$ ．这促使我们寻找 $f$ 的一个准则——预测（平方）误差的期望 $EPE(f)=E(Y-f(x))^2\tag{2.9}$ 用积分的形式表示就是
$\begin{aligned} \rm{EPE}(f)&=E(Y-f(X))^2\qquad\qquad\\ &=\int[y-f(x)]^2\Pr(dx,dy)\tag{2.10} \end{aligned}$