线性判别分析(LDA)原理

LDA介绍

LDA是一种监督学习的降维技术,也就是说它的数据集的每个样本是有类别输出的,主要就是将数据在低维度上进行投影,投影后希望每一种类别数据的投影点尽可能的接近,而不同类别的数据的类别中心之间的距离尽可能的大。总结来说就是“投影后类内方差小,类外方差大”。

二类LDA原理

假设我们有两类数据,,分别记为C和C2,首先计算两类数据的均值向量:n1,n2代表样本数量

 计算类内散布矩阵Sw:

接着就是

目标是找到一个投影方向  ,使得投影后的类间散布与类内散布的比值最大化,即: 

通过解决这个优化问题,得到最优的投影方向w。

多类LDA原理

假设又K个类别C1,C2,C3……Ck。

计算总体均值向量:

其中n是总样本数量,ni是第i类的样本数量,  ui是第i类的均值向量。

类内散布矩阵Sw:

类间散布矩阵Sb:

同样寻找一个投影方向  ,使得投影后的类间散布与类内散布的比值最大化:

求解此优化问题得到最优投影方向。在实际应用中,通常会将数据投影到一个低维子空间,以实现降维和分类。

LDA算法流程

参考文章:https://github.com/ljpzzz/machinelearning        https://www.cnblogs.com/pinard/p/6249328.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值