特定条件下经验风险最小化等价于极大似然估计的证明

最新推荐文章于 2024-07-16 13:12:21 发布

Orange先生

最新推荐文章于 2024-07-16 13:12:21 发布

阅读量1.4w

点赞数 7

分类专栏：机器学习文章标签：机器学习算法李航

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xmu_jupiter/article/details/44965391

版权

机器学习专栏收录该内容

30 篇文章 7 订阅

订阅专栏

看过李航老师的《统计学习方法》的同学都知道，机器学习（统计学习）的三要素为：模型、策略、和算法。其中，模型就是所要学习的条件概率分布或者决策函数。模型的假设空间包含所有可能的条件概率分布或决策函数。统计学习的目标在于从假设空间中选取最优模型。其中的两种选择最优模型的策略就是经验风险最小化和结构风险最小化。而算法负责根据策略求解出最优模型。

今天我尝试着给出《统计学习方法》第9页的“当模型是条件概率分布，损失函数是对数损失函数时，经验风险最小化就等价于极大似然估计。”的简单证明，有不对的地方请大家指正。

首先给出经验风险最小化的公式：

其中，F是假设空间，f是模型，L是损失函数，n是观察到的样本数。

下面引用一段其它博客的关于最大似然估计的内容：

**************************我是华丽的分割线***********************

最大似然估计中采样需满足一个很重要的假设，就是所有的采样都是独立同分布的。下面我们具体描述一下最大似然估计：

首先，假设为独立同分布的采样，θ为模型参数,f为我们所使用的模型，遵循我们上述的独立同分布假设。参数为θ的模型f产生上述采样可表示为

回到上面的“模型已定，参数未知”的说法，此时，我们已知的为，未知为θ，故似然定义为:

　　

　　在实际应用中常用的是两边取对数，得到公式如下：

　　其中称为对数似然，而称为平均对数似然。而我们平时所称的最大似然为最大的对数平均似然，即：

　　

***********************我是华丽的分割线*********************

可以看出，最大似然估计实际是：

将需要求和的ln前面加上负号，也就是：

对比经验风险最小化公式：

由于f( | )是模型，可以是条件概率分布模型，那么便可以看做是对数似然损失函数。可以明显看出此时的经验风险最小化就等价于极大似然估计。

关注

7
点赞
踩
20

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。