不知道你是否看过我之前的文章,如果看了的话,你会认为很烂,然后判断这篇博客也是很大程度上是很烂的,如果这样的,很幸运,那你使用了贝叶斯思维方式来进行思考问题了。
学了这么多年贝叶斯公式,不是很了解贝叶斯公式,但是今天和师兄去聊似然函数的时候,聊到了贝叶斯公式,感觉可以去解释人生当中做的一些判断。下面是这篇博客的要讲的三个问题
1.频率学派和贝叶斯学派的区别?
2.什么叫似然函数,它从直觉意义上表示什么意思,为什么要进行“最大”似然估计?为什么在最优化的时候需要取log?
3.贝叶斯公式感悟?
一:频率学派和贝叶斯学派的区别?
首先讲下,在概率统计上,有两个学派,一个是频率学派,一个是贝叶斯学派,“最大”似然是频率学派提出的。为什么将最大用引号呢,因为似然函数是两个学派共有的。那频率学派和贝叶斯学派有什么根本的区别呢?
你从名字就可以看出来他们关心的就是我有多大把握去圈出那个“唯一”的真实参数。而贝叶斯学派恰恰相反,他们关心参数空间里的“每一个值”,因为他们觉得我们又没有上帝视角,怎么可能知道哪个值是正确的呢?所以参数空间里的每个值都有可能是真实模型使用的值,区别只是概率不同而已。最好诠释这种差别的例子就是想象如果你的后验分布是双峰的,频率学派的方法会去选这两个峰当中较高的那一个对应的值作为他们的最好猜测,而贝叶斯学派则会同时报告这两个值,并给出对应的概率。
在二十世纪之前,频率学派发展很迅速很快占据了概率统计半壁江山,现在很多本科教材大量的篇幅使用的都是频率学派的认识。而贝叶斯学派的东西只是一笔带过,很大