贝叶斯决策类条件概率密度估计：最大似然和贝叶斯参数估计

最新推荐文章于 2025-04-13 20:03:52 发布

yuanwyue

最新推荐文章于 2025-04-13 20:03:52 发布

阅读量6.6k

点赞数 1

分类专栏：模式识别文章标签：最大似然估计贝叶斯估计贝叶斯分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shunaoxi2313/article/details/82854467

版权

有监督参数估计是指已知分类器结构或函数形式，从训练样本中估计参数。

本文主要介绍贝叶斯决策（详见贝叶斯决策的过程）条件概率密度的有监督参数估计过程。方法有最大似然估计和贝叶斯参数估计法。

最大似然估计

假设参数为确定值，根据似然度最大进行最优估计。

给定数据 $D_1,D_2...D_c$ 表示不同类别的样本。假设每类样本独立同分布（i.i.d. 万年不变的假设），用 $D_i$ 来估计 $θ_i$ ，即对每个类求一个判别函数，用该类的样本来估计判别函数的参数。
贝叶斯决策过程
注意区分特征空间和参数空间。参数估计的任务是得到 $p(x|w_i)$ 的形式，是在参数空间进行的。不妨设特征空间为d维，参数空间p维。
为了估计参数，需要如下几个步骤：

求似然（Likelihood） $=\prod_{k=1}^{n}p(x_k|θ)$
注意，上面这个式子针对的已经是具体的类别 $w_i$ 了，不要问 $w$ 参数去哪了。另外，这里的n代表样本数目，要和前面的类别数目c区分开。这个式子很好理解，即出现我们当前观测到的样本概率，求使它最大化的参数即可。
最大化似然 $max_θp(D|θ)→▽_θp(D|θ)=0$
这个梯度是在p维参数空间求解，即 $▽_θp= \begin{bmatrix} \frac{\partial}{\partialθ_1}\\ ...\\ ...\\ \frac{\partial}{\partialθ_p} \end{bmatrix}$
求解梯度。可求解析解或梯度下降。（常用Log-Likelihood，易求解）

当先验 $P(\theta)$ 都相等时等同于最大后验概率（MAP）决策。

高斯密度最大似然估计

以贝叶斯决策过程里给出的高斯密度假设为例，对它进行最大似然参数估计。首先假设 $\sigma$ 已知，对 $\mu$ 进行估计。

单点情况：
在这里插入图片描述

对于所有样本：
在这里插入图片描述

估计值即为观测样本均值。

再来看 $\mu$ 和 $\sigma$ 都未知的情况。设数据服从一维高斯分布， $\theta_1=\mu$

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。