线性判别分析LDA,LDA是一种监督学习的降维技术,也就是说它的数据集的每个样本是有类别输出的。也就是说分类技术,更或者说,降维技术就是分类技术。LDA的思想可以用一句话概括,就是“投影后类内方差最小,类间方差最大”。如下图所示:
假设我们有两类数据 分别为红色和蓝色,如下图所示,这些数据特征是二维的,我们希望将这些数据投影到一维的一条直线,让每一种类别数据的投影点尽可能的接近,而红色和蓝色数据中心之间的距离尽可能的大。以上就是LDA的主要思想了,当然在实际应用中,我们的数据是多个类别的,我们的原始数据一般也是超过二维的,投影后的也一般不是直线,而是一个低维的超平面。这就叫做降维,那么分类。。。这不分好了吗?
降维方法线性判别分析(Linear Discriminant Analysis, 以下简称LDA)
感觉还是说把之前的学了吧。。。