线性判别分析(一)——LDA介绍
线性判别分析(二)——Bayes最优分类器的角度看LDA
1. LDA的基本思想
LDA(Linear Discriminant Analysis, 线性判别分析)由Fisher于1936年提出,又称为Fisher线性判别(FDA)。
注:LDA和FDA并不完全等价,LDA假设每个类别内的实例服从高斯分布并且不同类别对应的高斯分布的协方差矩阵相同。本篇博客介绍的其实是FDA,但我们不做细分,统一称作LDA。
LDA既可以用于解决分类问题,又可以对数据进行降维处理。
基本思想
将高维的样本数据投影到判别向量空间,以达到抽取分类信息和降低特征维数的效果,投影后保证数据在新的子空间中有最大的类间距离和最小的类内距离,即在该子空间有最佳的可分离性。
2. LDA用于二分类问题
本节我们会讨论二分类问题上LDA思想的应用。给定训练样本 D={
(xi,yi),i=1,⋯,m} ,其中 xi∈Rd 为第 i 个实例对应的特征向量,
在二分类问题上,LDA通过线性变换
2.1 目标函数
假设投影空间中的实例集合为 Z={ z1,z2,⋯,zm} ,其中 zi=ωTxi 。类似于原始空间中的集合定义,我们用 Zc 表示投影空间中c类别实例集合。
记 x¯c 表示集合 Xc 的均值,则
记 z¯c 表示集合 Zc 的均值,则
根据(1)(2)(3)可以推出