解决二分类问题,假设两个类各自都服从正态分布。思想为将样本投影到一条直线上,使得同类的样本点投影尽可能接近,异类的样本点投影尽可能远离(组内方差小组间方差大)。训练完成后,给定一个新的点,将其投影到同一直线上,根据在直线上的位置预测其分类。
二分类LDA
样本为
因变量
令
表示投影直线的方向向量和第i类样本的集合、均值向量、协方差矩阵。
两类样本的均值在直线上的投影为
根据协方差矩阵的性质可知其投影点的方差为
注意空间中的点投影到直线上都变成了一维的实数而非向量,表示投影到直线上之后到原点O的距离。
为实现开头所说的尽量靠近组间尽量远离,我们最大化如下函数
定义两个取值已知的矩阵
则
注意上式分子分母展开后都是w的二次项,对w乘以一个非零系数上式取值不变,因此上式只与w的方向有关而与其长度无关,所以我们添加一个约束条件得到如下优化问题:
通过拉格朗日乘子法可以得到
根据
可知左边的方向恒为
因此不妨令
从而有
多分类LDA
假设存在N个类,第i类的样本量为n_i,令
表示投影矩阵和第i类样本的集合、均值向量、协方差矩阵。
定义全局散度矩阵为
其中mu是整个样本的均值向量。定义类内散度矩阵为
定义类间散度矩阵为
我们取优化目标为
其中W是d×(N-1)维实数值矩阵。