统计学习方法三要素

最新推荐文章于 2023-07-17 17:30:20 发布

为中华之富强而读书.

最新推荐文章于 2023-07-17 17:30:20 发布

阅读量325

点赞数

文章标签：学习机器学习人工智能

本文链接：https://blog.csdn.net/admincxy123/article/details/125566541

版权

统计学习方法三要素

统计学习方法可以简单的表示为：
方法=模型+策略+算法

模型

在监督学习过程中：
定义：所要学习的条件概率分布或决策函数
注：模型的假设空间（hypothesis space）包含的所有可能的条件概率分布或决策函数

假设空间用 $\mathcal{F}$ 表示

非概率模型

决策函数的集合（假设空间）
$\mathcal{F}=\{f \mid Y=f(X)\}$
其中X和Y是定义在输入空间和输出空间上的变量
$\mathcal{F}$ 通常是由一个参数向量决定的函数族
$\mathcal{F}=\left\{f \mid Y=f_{\theta}(X), \theta \in \mathbf{R}^{n}\right\}$
注：参数向量是 $θ$ , $R^n$ 为参数空间

概率模型

假设空间定义为条件概率集合：
$\mathcal{F}=\{P \mid P(Y \mid X)\}$
由一个参数向量决定条件概率分布族
$\mathcal{F}=\left\{P \mid P_{\theta}(Y \mid X), \theta \in \mathbf{R}^{n}\right\}$
注：参数向量是 $θ$ , $R^n$ 为参数空间

策略

思想:有了模型的假设空间后，接着需要考虑的是按照什么样的准则学习或者学则最优的模型。统计学习的目标在于从假设空间中选取最优的模型。
作用：选择最优模型

三大函数概念

损失函数：度量模型一次预测的好坏（真实值与预测值之间的差异）,记： $L (Y, f (X))$
风险函数：度量平均意义下模型预测的好坏，对损失函数求期望：
$\begin{aligned} R_{\exp }(f) &=E_{P}[L(Y, f(X))] \\ &=\int_{\mathcal{X} \times \mathcal{Y}} L(y, f(x)) P(x, y) \mathrm{d} x \mathrm{~d} y \end{aligned}$
其中 $P （ x, y ）$ 联合概率分布是未知的所以风险函数无法直接进行计算我们又选择经验风险
经验风险：模型关于训练集的平均损失
对于给定数据集： $T=\left\{\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right), \cdots,\left(x_{N}, y_{N}\right)\right\}$
经验风险记作： $R_{\mathrm{emp}}$
期望经验：R_{\exp }(f)
根据大数定律：当样本容量 $N$ 趋于无穷时，经验风险趋于期望风险。