7.2 极大似然估计

最新推荐文章于 2021-08-02 13:10:52 发布

pjiang000

最新推荐文章于 2021-08-02 13:10:52 发布

阅读量522

点赞数

分类专栏：机器学习文章标签：机器学习人工智能 python 深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44412864/article/details/115677701

版权

机器学习专栏收录该内容

48 篇文章 3 订阅

订阅专栏

7.2 极大似然估计

估计类条件概率的一种常用策略是先假设其具有某种确定的概率分布形式，然后再基于训练样本对概率分布的参数进行估计，具体的说，记关于类别C的类条件概率为P（X|C），假设P（X|C）具有确定的形式并且被参数向量的θ 唯一确定，则我们的任务就是利用训练集 D估计参数 θ 。为了明确起见，我们将 P（X|C）记做是 P（X|θ ）

事实上，概率模型的训练过程就是参数估计的过程，对于参数估计，统计学界的两个学派分别提供了两种不同的解决方案，频率主义学派认为参数虽然是未知的，但是确实客观存在的，因此，可以通过优化似然函数等准则来确定参数值；

贝叶斯学派则认为参数是未观察到随机变量，其分布也可以有分布，因此，可以假设参数服从一个先验分布，然后基于观察到的数据来计算参数的后验分布。本节介绍源于频率主义学派的极大似然估计，这是根据数据的采样估计概率分布参数的经典方法。

Dc表示训练集D中第c类样本组成的集合，假设这些样本是独立同分布的，则参数θ对于数据集的似然是P（D|Θ）=乘积 P（X| Θ）。

对Θ进行极大似然估计，就是去寻找能够最大化似然 P（D|Θ）的参数 Θ，直观上来看，极大似然估计就是在Θ所有可能的去之中，找到一个能够使得数据出现的可能性最大的数值。

连乘操作容易造成下溢，通常使用对数似然

例如，在连续属性的情形下，假设概率密度函数 P（X|C） ~ N（ X，d^2)，则参数X和d的极大似然估计就是

也就是说，通过极大似然法得到的正态分布均值就是样本的均值，方差就是（X-a）（X-a）T的均值，这是一个符合直觉的结果，在离散属性的情形下，也可以通过类似的方法估计类条件概率。

需要注意的是，这种参数化的方法虽然能够使得类条件概率估计变得相对的简单，但是估计结果的准确性严重的依赖于所假设的概率分布形式是否符合潜在的真实数据分布。在现实的生活中，想要做出能够较好的接近潜在真是分布的假设，往往需要在一档程度上利用关于应用任务本身的经验知识。如果仅仅是凭借着猜测来假设概率的分布形式，则可能会产生误导性的结果。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
7.2 极大似然估计

7.2 极大似然估计估计类条件概率的一种常用策略是先假设其具有某种确定的概率分布形式，然后再基于训练样本对概率分布的参数进行估计，具体的说，记关于类别C的类条件概率为P（X|C），假设P（X|C）具有确定的形式并且被参数向量的θ 唯一确定，则我们的任务就是利用训练集 D估计参数 θ 。为了明确起见，我们将 P（X|C）记做是 P（X|θ ）事实上，概率模型的训练过程就是参数估计的过程，对于参数估计，统计学界的两个学派分别提供了两种不同的解决方案，频率主义学派认为参数虽然是未知的，但是确实客观存
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。