机器学习三要素

最新推荐文章于 2023-12-14 22:03:09 发布

tigerlib

最新推荐文章于 2023-12-14 22:03:09 发布

阅读量594

点赞数

分类专栏： machine learning 文章标签：机器学习三要素模型策略算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44695969/article/details/99738304

版权

machine learning 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

机器学习三要素

方法=模型+策略+算法

模型 $f (X)$
- 模型 $f (X)$ 的假设空间 $\mathcal{F}$ ：包含所有可能的条件概率分布或决策函数。
- 假设空间定义为决策函数的集合：
  - $\mathcal{F}=\{f|Y=f(X)\}$ ，其中， $X$ 和 $Y$ 是定义在输入空间 $\mathcal{X}$ 和输出空间 $\mathcal{Y}$ 上的变量
  - $\mathcal{F}=\{f|Y=f_{\theta}(X), \theta\in R^n\}$ ，其中， $\theta$ 称为参数空间（parameter space），取值于 $n$ 维欧式空间 $R^n$ 。
- 假设空间定义为条件概率的集合：
  - $\mathcal{F}=\{P|P (Y|X)\}$
  - $\mathcal{F}=\{P|P_\theta (Y|X), \theta\in R^n\}$
策略
- 损失和风险
  - 损失函数度量模型一次预测的好坏，风险函数度量平均意义下模型预测的好坏
  - 常用的损失函数
    
    （1） $0 - 1$ 损失函数（0-1 loss function）： $L(Y,f(X))=\begin{cases} 1, & {Y \neq f(X)} \\ 0, & {Y=f(X)} \end{cases}$
    
    （2）平方损失函数（quadratic loss function）： $L(Y,f(X))=(Y-f(x))^{2}$
    
    （3）绝对损失函数（absolute loss function）： $L (Y, f (X)) = ∣ Y - f (x) ∣$
    
    （4）对数损失函数（logarithmic loss function）或对数似然损失函数（log-likelihood loss function）： $L(Y,P(Y|X))=-\log P(Y|X))$
  - 风险函数（risk function）或 期望损失（expected loss）：即损失函数的期望
    
    $R_{exp}(f)=E_{P}[L(Y,f(X))]=\int_{\mathcal{X}\times\mathcal{Y}}L(y,f(x))P(x,y)dxdy$
  - 经验风险（empirical risk）或 经验损失（empirical loss）：模型 $f (X)$ 关于训练集 $T$ 的平均损失
    
    $R_{emp}(f)=\frac{1}{N}\sum^{N}_{i=1}L(y_{i},f(x_{i}))，当N\to\infty时，R_{emp}(f)\approx R_{exp}(f)。$
    
    根据大数定律，当样本容量趋于无穷时，经验损失趋于期望损失。所以一个很自然的想法是用经验损失 来估计 期望损失。
- 监督学习的两个基本策略：经验风险最小化和结构风险最小化
- 经验风险最小化：经验风险最小的模型是最优的模型
  
  $\min_{f\in\mathcal{F}}R_{emp}(f)=\min_{f\in\mathcal{F}}\frac{1}{N}\sum^{N}_{i=1}L(y_{i},f(x_{i}))$
- 结构风险最小化（正则化）（structural risk minimization，SRM）：结构风险最小的模型是最优的模型
  - 结构风险
    - 结构风险：经验风险 + 正则化项（regularizer）或罚项(penalty term)
      $R_{srm}(f)=R_{emp}(f)+\lambda J(f)=\frac{1}{N}\sum^{N}_{i=1}L(y_{i},f(x_{i}))+\lambda J(f)$
    - $J (f)$ 为模型的复杂度，是定义在假设空间 $\mathcal{F}$ 上的泛函。
      - 模型 $f$ 越复杂， $J (f)$ 就越大；模型 $f$ 越简单， $J (f)$ 就越小。
    - $\lambda\geq0$ ，是一个系数，用以权衡经验风险和模型复杂度
  - 结构风险最小化
    $\min_{f\in\mathcal{F}}R_{srm}(f)=\min_{f\in\mathcal{F}}\frac{1}{N}\sum^{N}_{i=1}L(y_{i},f(x_{i}))+\lambda J(f)$
算法
- 机器学习问题归结为最优化问题
- 机器学习的算法成为求解最优化问题（损失/风险最小化）的算法

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习三要素

机器学习三要素方法=模型+策略+算法模型 f(X)f(X)f(X)模型 f(X)f(X)f(X) 的假设空间 F\mathcal{F}F：包含所有可能的条件概率分布或决策函数。假设空间定义为决策函数的集合：F={f∣Y=f(X)}\mathcal{F}=\{f|Y=f(X)\}F={f∣Y=f(X)}，其中，XXX 和 YYY 是定义在输入空间 X\mathcal{X}X...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。