1.最大似然估计和贝叶斯估计区别
https://blog.csdn.net/bitcarmanlee/article/details/52201858
贝叶斯估计https://blog.csdn.net/zengxiantao1994/article/details/72889732
最大似然估计没有考虑模型本身的概率,或者说认为模型出现的概率都相等。而贝叶斯估计将模型出现的概率用先验概率的方式在计算过程中有所体现。
从本质上来说,最大似然是对点估计,贝叶斯推断是对分布估计。即,假设求解参数θθ,最大似然是求出最有可能的θθ值,而贝叶斯推断则是求解θθ的分布。
最大似然是对于已有数据的概率估计,而贝叶斯加入了已获数据的先验概率,这个先验概率为获取到的数据占所有数据的概率 。
各自优缺点:
MLE简单又客观,但是过分的客观有时会导致过拟合(Over fitting)。在样本点很少的情况下,MLE的效果并不好。比如我们前面举的病毒的例子。在这种情况下,我们可以通过加入先验,用贝叶斯估计进行计算。
贝叶斯估计最要命的问题是,实际应用场景中的先验概率不是那么好求,很多都是拍脑袋决定的。一旦是拍脑袋决定的,这玩意自然就不准;更有甚者,很多时候是为了方便求解生造出来一个先验。那既然这样,要这个先验还有什么卵用呢?所以频率派的支持者就揪住这点不放攻击贝叶斯派。
2.结构风险,经验风险
https://blog.csdn.net/u011630575/article/details/79378102
3.条件独立和相互独立
条件独立是给定条件下两个独立,相互独立是无论怎么都独立。
https://www.zhihu.com/question/51543503