李航 统计学习方法 第一章 习题 参考答案

1.1  说明伯努利模型的极大似然估计以及被压死估计中的统计学习方法三要素。

统计学习三要素:模型、策略和算法。

伯努利模型的极大似然估计

 模型策略算法
极大似然估计条件概率经验风险最小化求解析解
贝叶斯估计条件概率结构风险最小化求数值解

伯努利模型是定义在取值为0和1的随机变量上的概率分布。

\begin{aligned}& P(Y=1) = \Theta \\ &P(Y=0) = 1-\Theta \end{aligned}

极大似然估计:

似然函数的对数:

\begin{aligned}log(L(\Theta ))&=log( \prod_{i=1}^{ N}P(Yi)) \\&=log( \Theta^{k}(1-\Theta )^{n-k} )\\&=klog(\Theta )+(n-k)log(1-\Theta ) \end{aligned}

其中,n为实验次数,k为n次实验中结果为1的次数,Yi表示第i次实验的结果。

令对数似然的导数为0可以直接求出解析解:

\Theta =\frac{k}{n}

贝叶斯估计:

P(\Theta |Y1,Y2,...,Yn) = \frac{P(Y1,Y2,...,Yn|\Theta )*P(\Theta)}{P(Y1,Y2,..,Yn)}

根据先验概率P(\Theta )P(Y1,Y2,...,Yn)估计后验概率,使后验概率最大化。

所以贝叶斯估计得到的概率取决于所选择的先验分布。

PS:对于伯努利模型,可以使用beta分布作为贝叶斯估计的先验概率。

 

1.2  证明:模型是条件概率分布,当损失函数是对数损失时,经验风险最小化等价于极大似然估计。

首先需要理解几个概念,条件概率分布,对数损失,经验风险和极大似然估计。

模型是条件概率分布,说明预测值:

f(X)=P(Y|X)=\frac{P(X,Y)}{P(X)}

对数损失的定义为:

L(Y,P(Y|X))=-\log P(Y|X)

此时,经验风险R为:

\begin{aligned} R&=\frac{1}{N}* \sum_{i=1}^{N}L(Yi,f(Xi)) \\ &=\frac{1}{N}*\sum_{i=1}^{N}L(Yi,P(Yi|Xi)) \\&= \frac{1}{N}*\sum_{i=1}^{N}L(-log(P(Yi|Xi))) \\& = - \frac{1}{N}*log(\prod _{i=1}^{N}\frac{P(Xi,Yi)}{P(Xi)}) \end{aligned} 

所以,最小化经验风险R,相当于最大化似然估计

log(\prod _{i=1}^{N}\frac{P(Xi,Yi)}{P(Xi)})

  • 5
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值