线性判别分析LDA
为了最优分类,我们要计算后验概率 P(G|X) 。 设fk(x) 是类 G=k 中 X 的类条件密度,而
假定我们用多元高斯分布对每个类密度建模
fk(x)=1(2π)p/2|Σk|1/2exp(−1/2(x−μk)TΣ−1k(x−μk)
线性判别分析假定所有类具有共同的协方差矩阵,即
Σk=Σ
这样,为了比较两个类,只需要考察对数比率
logP(G=k|X=x)P(G=l|X=x)=logfk(x)fl(x)+logπkπl
=logπkπl−1/2(uk+ul)Σ−1(uk+ul)+xTΣ−1(uk−ul)
这是x上的线性方程。相等的协方差矩阵使得我们可以消去二次项,因此任意两个类别的判定边界都是一个超平面。
从上面的判别边界可以看出,线性判别函数
δk(x)=logπk−1/2ukΣ−1uk+xTΣ