算法思想
线性判别分析一种经典的线性学习方法,适用于二分类问题。算法思想是:将给定样例投影到一条直线上,使得同类样本投影点尽可能相近,即同类样本方差小,异类样本投影点尽可能远离,即异类样本中心尽可能远离。
参数估计
给定数据集,,令Xi、μi、Σi分别表示第i∈{0,1}类示例的集合、均值向量、协方差矩阵,即。若将数据投影到直线w上,则两类样本的中心在直线上的投影分别为和,两类样本的协方差分别为和。
若同类样本方差尽可能小,则尽可能小;若异类样本中心尽可能远离,则尽可能大。所以综合得到,
尽可能大。变换得,
令,
我们称为“类内散度矩阵”,为“类间散度矩阵”。
则,
此为最大化目标,也是相对于的广义瑞利商。
我们可以用“拉格朗日乘子法”求。
因为我们不关心w的大小,只关心其方向,所以可以令分母为1,即为1.则式子等价于,
s.t.
构建拉格朗日函数,.
对w求偏导,.
令上式为0,.
为实数,由于我们不关心w的大小,所以可以令,同时也不用约束条件,则得到.
还可以把LDA推广到多分类任务中,定义“全局散度矩阵”
.
可以使用,,中的任意两个来实现多分类LDA.