这里就对另外一种经典的降维方法线性判别分析(Linear Discriminant Analysis, 简称LDA)做一个总结。LDA在模式识别领域(比如人脸识别,数字识别,舰艇识别等图形图像识别领域)中有非常广泛的应用
代码github 仓库地址:https://github.com/cloudlwg/Machine-learning.git
LDA思想
LDA是一种监督学习的降维技术,也就是说它的数据集的每个样本是有类别输出的,这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括,就是“投影后类内方差最小,类间方差最大”,如下图所示。 我们要将数据在低维度上进行投影,投影后希望每一种类别数据的投影点尽可能的接近,而不同类别的数据的类别中心之间的距离尽可能的大。
**
下面就是代码实现了,这里我带大家通过一个简单的例子 “输血数据分析blood”来代码实现,而且不能用任何机器学习包,这样便于大家更好的理解。blood数据集大家可以自行下载
**
# -*- coding: