![在这里插入图片描述](https://img-blog.csdnimg.cn/6c7374d5343745f0912e8bd7842687a0.png#pic_center)
Hi, 你好。我是茶桁。
今天让我们来学习一下「贝叶斯统计」和「机器学习分类指标」,这两部分结束之后,咱们《概率和统计》的部分就结束了。不知道这段时间的内容对大家是否有帮助。
好,咱们正课走起。
贝叶斯统计
贝叶斯是非常厉害的一个人,在统计学里面贝叶斯做出了太多的贡献。就包括在概率里面,有频率派,也有贝叶斯派。当然在机器学习里面,也有贝叶斯派。就是从贝叶斯的角度去考虑机器学习的模型,和神经网络的连接主义是对立的关系。
说到贝叶斯统计,肯定绕不开贝叶斯公式,一个大数学家、统计学家提出的这么一个公式。以他命名的公式如下:
P(Y|X) = P(X|Y)P(Y) / P(X)
这个式子特别简单,就是由条件概率和联合概率的公式得到的。为什么能得到这个式子?咱们把分母P(X)乘到式子左边去,左边P(Y|X)乘以P(X),不就是X和Y的联合概率嘛。等式左右两边都是一个联合概率,所以把P(X)拿到右边作为分母,这个式子就出来了。就是这么简单,贝叶斯公式就是这么简单。
我们来看一下这个公式里面各个量的一些含义。按照贝叶斯的语言,X代表了可被观测到的样本。观测到的这个样本就是可以看见了,可以统计出来,可以数出来的。比如抛硬币,正面朝上多少次,反面朝上多少次,这个可观测到的。
然后,Y代表了产生这个样本的内在机制的参数,或者说产生这个样本的概率模型的这么一个参数,就比如说均值方差