后验概率
以下 代表因,
代表果。
先验概率:在结果发生前就根据历史规律确定原因的概率分布,即
后验概率:已知结果,据此猜原因的概率分布,即
似然估计:先定下原因,根据原因估计结果的概率分布,即
贝叶斯公式: ,在此即可写为:
即:后验概率 = 似然估计 * 先验概率 / evidence
此处 即为不考虑原因只看结果的概率分布,即 evidence ,又称样本发生的概率分布的证据
换言之, 是在观测前凭借先验知识对待估参数的认识,
是确定了参数以后的试验结果概率分布,
是与待估参数无关的边缘分布,计算时采用
,
反映了在给定试验数据的基础上,对参数的新的认识,是贝叶斯分析的结果。注意后验概率是可以不断更新的,上一次实验计算得到的后验概率可以作为下一次的先验
MAP/ML/贝叶斯估计
给定一些数据样本 ,已知其是从某分布中取出的,但并不知道该分布的参数
使用最大似然估计(maximum likelihood):找出使分布产出数据 概率最大的参数
:
若该参数存在先验概率,则使用最大后验估计(maxaposterior),优化后验概率:
给定 后
大小与参数无关,故此处仅作归一项,即后验概率正比于先验概率乘似然函数
贝叶斯推断求解过程
待估参数 (视为随机变量),观测到样本数据
,从中提取用于估计的信息
① 确定 的先验分布
或
(用以区分离散或连续)。
② 确定观测数据 的分布模型,是一个基于随机变量
的条件概率分布
或
③ 观察到 的一个特定值
后,就可以进行计算: