机器学习笔记之高斯分布(五)推断任务之边缘概率分布与条件概率分布

引言

上一节介绍了高斯分布概率模型相关的推断问题,并详细介绍了给定联合概率分布求解条件概率分布。本节将继续介绍推断任务——基于随机变量之间存在线性关系的条件下,求解条件概率与边缘概率。

回顾:

卡尔曼滤波

卡尔曼滤波(Kalman Filter)本身是线性高斯动态模型(Linear Gaussian Dynamic Model)的代表,它的性质表示在如下过程:

  • 状态转移概率 P ( i t ∣ i t − 1 ) \mathcal P(i_t \mid i_{t-1}) P(itit1)
    需要注意的点:卡尔曼滤波是‘动态模型’的一种表达,它依然受到‘齐次马尔可夫假设’的约束。
    一阶齐次马尔可夫假设为例,线性高斯动态模型中的相邻隐变量之间存在线性关系,并且对应噪声 ϵ \epsilon ϵ服从高斯分布
    i t = A ⋅ i t − 1 + B + ϵ ϵ ∼ N ( 0 , Q ) i_t = \mathcal A \cdot i_{t-1} + \mathcal B + \epsilon \quad \epsilon \sim \mathcal N(0,\mathcal Q) it=Ait1+B+ϵϵN(0,Q)
    对应概率分布表示如下:
    这种表示方法需要注意。它写的是 N ( A ⋅ i t − 1 + B , Q ) \mathcal N(\mathcal A \cdot i_{t-1} + \mathcal B,\mathcal Q) N(Ait1+B,Q)而不是 A μ + B \mathcal A \mu + \mathcal B Aμ+B。因为 N ( A μ + B , A Q A T ) \mathcal N(\mathcal A \mu + \mathcal B,\mathcal A\mathcal Q\mathcal A^T) N(Aμ+B,AQAT)表示 i t i_t it的边缘概率分布。并且,这种写法意味着 i t − 1 i_{t-1} it1是已知的,可观测的。
    { P ( i t − 1 ) ∼ N ( μ , Q ) P ( i t ∣ i t − 1 ) ∼ N ( A ⋅ i t − 1 + B , Q ) \begin{cases} \mathcal P(i_{t-1}) \sim \mathcal N(\mu,\mathcal Q) \\ \mathcal P(i_{t} \mid i_{t-1}) \sim \mathcal N(\mathcal A \cdot i_{t-1} + \mathcal B,\mathcal Q) \end{cases} { P(it1)N(μ,Q)P(itit1)N(Ait1+B,Q)
    这个式子表示的是关于随机变量自身的线性关系还是期望的线性关系?使用例子描述一下:

    • 已知一个二维高斯分布,它各维度服从的高斯分布如下:
      x 1 ∼ N ( 0 , 1 ) x 2 ∼ N ( 0 , 1.5 ) x_1 \sim \mathcal N(0,1) \quad x_2 \sim \mathcal N(0,1.5) x1N(0,1)x2N(0,1.5)
      对应图像表示如下:
      二维高斯分布-样本示例
    • 定义一个线性关系 Y = 2 X + 2 \mathcal Y = 2\mathcal X + 2 Y=2X+2,上述样本点在线性计算之后的分布表示如下(橙色样本点):
      样本线性变化后的分布结果
      注意,这里仅对原始的样本结果(蓝色样本点)进行线性计算,没有添加其他噪声。从图像中明显观察到:均值已经发生了变化(两团样本的密集区域没有重合在一起)。
      均值由0变成了 2x0+2=2。
      因此, P ( i t ∣ i t − 1 ) ∼ N ( A ⋅ i t − 1 + B , Q ) \mathcal P(i_{t} \mid i_{t-1}) \sim \mathcal N(\mathcal A \cdot i_{t-1} + \mathcal B,\mathcal Q) P(itit1)N(Ait1+B,Q)既表示随机变量的线性关系,也表示期望的线性关系
      需要再次强调, P ( i t ) , P ( i t ∣ i t − 1 ) \mathcal P(i_{t}),\mathcal P(i_t \mid i_{t-1}) P(it),P(itit1)它们两个代表不同的高斯分布。而 A Q A T \mathcal A\mathcal Q\mathcal A^T AQAT是‘基于’ i t = A ⋅ i t − 1 + B i_t = \mathcal A \cdot i_{t-1} + \mathcal B it=Ait1+B线性计算的关于 i t i_t it的边缘概率分布 P ( i t ) \mathcal P(i_t) P(it)的协方差结果。
  • 发射概率 P ( o t ∣ i t ) \mathcal P(o_t \mid i_t) P(otit)
    隐变量与对应时刻观测变量之间存在线性关系,斌且噪声服从高斯分布
    { o t = C ⋅ i t + D + δ δ ∼ N ( 0 , R ) P ( o t ∣ i t ) ∼ N ( C ⋅ i t + D , R ) \begin{cases} o_t = \mathcal C \cdot i_t + \mathcal D + \delta \quad \delta \sim \mathcal N(0,\mathcal R) \\ \mathcal P(o_t \mid i_t) \sim \mathcal N(\mathcal C \cdot i_t + \mathcal D,\mathcal R) \end{cases} { ot=Cit+D+δδN(0,R)P(otit)N(Cit+D,R)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

静静的喝酒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值