《统计机器学习》第一章学习笔记和习题

学习笔记

  1. 统计学习(统计机器学习)是关于计算机基于数据构建概率统计模型并运用模型对数据进行分析与预测的一门学科。

  2. 统计学习分类:
    (1)监督学习(supervised learning)
    (2)非监督学习(unsupervised learning)
    (3)半监督学(semi-unsupervised learning)
    (4)强化学习(reinforcement learning)

  3. 统计学习方法(三要素):
    (1)模型的假设空间(模型)
      假设空间可以定义为决策函数的集合

    F={ f|Y=f(X)} F = { f | Y = f ( X ) }

      也可以定义为条件概率集合
    F={ P|P(Y|X)} F = { P | P ( Y | X ) }

    (2)模型选择的准则(策略)
    (3)模型学习的算法(算法)

  4. 监督学习
      从给定有限的训练数据出发,假设数据是独立分布的。而且模型属于某个假设空间,应用某一评价准则,从假设空间中选取一个最优的模型,使它对已给训练数据及未知测试数据在给定评价标准意义下有最准确的预测。

  5. 损失函数
    (1)0-1损失函数

    L(Y,f(X))={ 1,0,Yf(X)Y=f(X) L ( Y , f ( X ) ) = { 1 , Y ≠ f ( X ) 0 , Y = f ( X )

    (2)平方损失函数
    L(Y,f(X))=(Yf(X))2 L ( Y , f ( X ) ) = ( Y − f ( X ) ) 2

    (3)绝对损失函数
    L(Y,f(X))=|Yf(X)| L ( Y , f ( X ) ) = | Y − f ( X ) |

    (4)对数损失函数
    L(Y,P(Y|X)=logP(Y|X) L ( Y , P ( Y | X ) = − l o g P ( Y | X )

  6. 期望损失(风险函数):理论上模型 f(X) f ( X ) 关于联合分布 P(X,Y) P ( X , Y ) 的平均意义下的损失。

    Rexp(f)=EP[L(Y,f(X))]=X×YL(y,f(x))P(x,y)dxdy R e x p ( f ) = E P [ L ( Y , f ( X ) ) ] = ∫ X × Y L ( y , f ( x ) ) P ( x , y ) d x d y

  7. 经验损失(经验风险):模型 f(X) f ( X ) 关于训练集的平均损失。

    Remp=1Ni=0NL(yi,f(xi)) R e m p = 1 N ∑ i = 0 N L ( y i , f ( x i ) )

  8. 经验风险最小化(emprical risk minimization, ERM):经验风险最小的模型是最优的模型。即求解最优化问题:

    minfF1Ni=0NL(<
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值