这就是贝叶斯公式的密度函数形式,在样本 X 给定下,θ 的条件分布被称为 θ 的后验分布。它是集中了总体、样本和先验等三种信息中有关 θ 的一切信息,而又是排除一切与 θ 无关的信息之后得到的结果,故基于后验分布 p(θ|X) 对 θ 进行统计推断是更合理的。
一般说来,先验分布 p(θ) 是反映人们在抽样前对 θ 的认识,后验分布 p(θ|X) 是反映人们在抽样后对 θ 的认识,之间的差异是由于样本的出现后人们对 θ 认识的一种调整,所以后验分布 p(θ|X) 可以看作是人们用总体信息和样本信息(抽样信息)对先验分布 p(θ) 作调整的结果。
最大似然:
最大似然没有考虑先验知识,仅凭样本数据进行预估,在样本量小的时候容易产生过拟合。
最大后验:
后验概率加入了先验和统计知识,是最稳定的,因此后验要比最大似然来的更稳健。
参考链接:https://blog.csdn.net/guleileo/article/details/80971601