第三章
下面进入对第三章的脉络分析。上一篇博客结尾处提到了书中35页的例题,我认为应该是第三章学完才能解决的问题。即根据现有的一些样本点,确定分界面,这样来一个新的样本点我们才能对其分类。我们知道,分界面其实就是两类后验概率的差(或者对数的差),后验概率可以由先验概率和类条件概率求得,由于先验概率一般给定,所以我们的所有精力都落在了求类条件概率上。
那如何根据样本点去求类条件概率密度呢?第二章后面是直接假设我们已知概率密度函数的形式和参数,但假如我们不知道呢?这就可以分为两类,当我们知道形式而不知道参数时,我们就需要第三章的参数估计方法去估计出参数,进而得到类条件概率密度。当我们连形式都不知道的时候,我们就需要第四章的非参数估计方法,直接估计出类条件概率密度。这里书中介绍了两种参数估计的方法:
1.最大似然估计
最大似然参数估计是要最大化似然函数,函数形式如下:
其中是以<