贝叶斯决策
贝叶斯决策是解决模式分类问题的一种基本方法。贝叶斯公式为:
,其中x为特征值,wj为第j个类别。公式可以理解为:后验概率=条件概率密度*先验概率/证据因子。先验概率通常容易得到,而证据因子可以看成一个标量,因此问题的关键在于对条件概率密度的估计。
高斯分布
通常可以用高斯分布来估计条件概率密度,多元正态密度的形式为:
,x为一个d维列向量,u是d维均值向量,Σ是d*d的协方差矩阵。
判别函数
对正态密度函数取对数,得到判别函数:
,对一个测试样本,将其归类为g(x)最大的那一类。
线性判别 LDF(linear differential form)
当每一类的协方差矩阵都相等时,讲二次型展开,并去掉与i无关的项,判别函数可简化为:
二次判别 QDF(quadratic differential form)
当每一类协方差任意时,判别函数为:
程序
下面用octave环境下实现了LDF和QDF(在matlab下也可运行),在MNIST数据集上的两者的正确率分别为:87.86%和95.67%
LQDF.m为:
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%author: j.cai
%%mail: jcai@mail.oom
%%date: 2016-10-11
%%%%%%%%%%%%%