理解机器学习中常见参数估计方法

daimashiren

已于 2023-04-23 20:34:20 修改

阅读量388

点赞数

分类专栏：机器学习文章标签：机器学习算法概率论

于 2023-04-23 14:59:43 首次发布

本文链接：https://blog.csdn.net/daimashiren/article/details/130321901

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

MLE算法

Maximum Likelihood Estimate (MLE) 中文名叫做极大似然估计。其核心思想是求解能够最大化拟合观测分布 $D$ 的参数 $\hat\theta$
$\hat\theta = argmax(P(D)|\theta)$
例如，假设抛硬币正面朝上的概率值 $\theta$ , 反面朝上的概率值为 $\theta$ 。假设每次抛硬币的过程是条件独立的，且符合（0-1）分布。用 $\alpha_{u}$ 和 $\ \alpha_d$ 分别表示抛了若干次硬币之后观察到的正面朝上和反面朝上的次数。则
$P(D|\theta) = P(\alpha_u, \alpha_d|\theta) = \theta^{\alpha_u} (1 - \theta)^{\alpha_d}$

利用MLE算法求解上述表达式:
$\hat\theta_{MLE} = argmax(P(D)|\theta) \\ \hat\theta_{MLE} = argmax(ln(P(D|\theta))) \\ \hat\theta_{MLE} = argmax(ln(\theta^{\alpha_{u}}(1-\theta)^{\alpha_d}))$

令其导数为0,求解极值点：
$\frac{d}{d\theta }ln(\theta^{\alpha_{u}}(1-\theta)^{\alpha_d}) = \alpha_u \frac{1}{\theta} - \alpha_d \frac{1}{1-\theta} = 0$

解得 $\hat\theta_{MLE} = \frac{\alpha_u}{\alpha_u + \alpha_d}$ 这符合我们的认知，概率值近似等于频率。

MAP 算法

Maximum a Posterior (MAP) 中文名叫最大后验概率估计。其核心思想是在极大似然估计(MLE)算法的基础上，假设参数 $\theta$ 符合某先验分布 $g(\theta)$ 则根据贝叶斯公式:
$P(\theta|D) = \frac{P(D|\theta)P(\theta)}{P(D)}$

由于P(D) 是已知的观测分布可以忽略，因此 $P(\theta|D) \propto P(D|\theta)P(\theta)$ (这里的 $\propto$ 表示“正比于”)，因此MAP的求解过程如下:
$\hat \theta_{MAP} = argmax(P(D)|\theta)P(\theta) = \hat \theta_{MLE} \space g(\theta)$

当参数 $\theta$ 的分布为常数分布时，最大后验概率估计等价于极大似然估计，即 $\hat \theta_{MAP} = \hat \theta_{MLE}$

EM 算法

Expectation-maximization algorithm (EM) 中文名叫期望最大化算法，其核心思想是当求解MLE算法或MAP算法的过程中依赖于某些不可观测的隐变量 $Z$ (不同于常规的可观测数据分布D，现在待计算的分布中有一些数据是不可观测的（例如缺失值），就需要使用EM算法)。则通过以下步骤进行参数估计：

初始化分布参数 ( $\theta$ )
E步骤: 根据参数的假设值，给出未知变量（隐变量）的期望估计，应用于缺失值。
M步骤: 根据未知变量（隐变量）的估计值，给出当前的参数的极大似然估计 $\hat \theta_{MLE}$ 。

重复2，3过程，直到收敛。

daimashiren

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
理解机器学习中常见参数估计方法

其核心思想是当求解MLE算法或MAP算法的过程中依赖于某些不可观测的隐变量。分别表示抛了若干次硬币之后观察到的正面朝上和反面朝上的次数。假设每次抛硬币的过程是条件独立的，且符合（0-1）分布。其核心思想是在极大似然估计(MLE)算法的基础上，假设参数。的分布为常数分布时，最大后验概率估计等价于极大似然估计，即。由于P(D) 是已知的观测分布可以忽略，因此。这符合我们的认知，概率值近似等于频率。例如，假设抛硬币正面朝上的概率值。重复2，3过程，直到收敛。, 反面朝上的概率值为。
复制链接

扫一扫