例子
举个例子,有200个人,其中100个人是玩王者荣耀的,100个人不玩王者荣耀。其中,在玩王者荣耀的100个人中,有80个男性、20个女性;在不玩王者荣耀的100人中,有80个女性、20个男性。
先验概率
所谓先验概率,就是通过统计的方式得到的概率,比如P(玩王者荣耀)=100/200=1/2,这个概率是我们通过已知的数据统计得到的,这就是先验概率。
后验概率
在区分这两个概率的时候,大家可以按照名字里的“先”、“后”这两个关键词,便于理解。
后验概率通俗来讲,就是在某件事情发生后才可以得到,即加上了一个限定条件,求解概率,如从这200人中挑出一个男性,那么这个男性玩王者荣耀的概率是多少?这就是一个后验概率,即P(玩王者荣耀|他是男性)。
按常规思路,我们的求解思路是这样的:已知他是一个男性,那么他玩王者荣耀的概率就为玩王者荣耀的男性占所有男性的比值即P=80/100=4/5。
利用贝叶斯准则,其计算公式为P(玩王者荣耀|他是男性)=P(玩王者荣耀)*P(他是男性|玩王者荣耀)/P(他是男性)
贝叶斯准则:P(x|y)=P(x)*P(y|x)/P(y)
极大似然估计
由上述可知,后验概率所要求的就是,一个男性,他玩王者荣耀的概率有多大,当后验概率越大时,那么他的标签意义就越大,即男性都比较喜欢玩王者荣耀。
极大似然估计就是利用已知的样本结果,反推最有可能导致这样结果的参数值。按我们的例子来说就是在求解P(玩王者荣耀)、P(他是男性|玩王者荣耀)分别为多少时,可以使P(玩王者荣耀|他是男性)最大。其求解过程一般是对似然函数取对数后,使其导数为零的值即为所要求取的参数,在此就不展开了。
以上理解都是自己的理解,肯定会存在一定的不足,希望大家批评指正,共同进步!