FDA是一个传统的有用的线性有监督的降维方法,FDA通过最大化类间距离,最小化类内距离的方法降维,但是对于呈现多峰的样本数据的降维效果并不好。为了对多峰数据降维,首要的是要保持数据的局部结构。LPP通过保持数据的局部结构获得很好的降维效果,但他只能用于无监督的情况,不能将样本的标签信息考虑在内。
由于类间散布矩阵不是满秩的,所以FDA只能将数据映射到维数小于类个数的低维空间,这是FDA的局限。
FDA
设
xi∈Rd(i=1,2,...,n)
,是d维空间中的样本,
yi∈{1,2,...,c}
是相关的标签集,
zi∈Rr(r<d)
是
xi
在低维空间的表示,
T
表示从
每类的均值:
ul=1nl∑i:yi=lxi
总的均值:
u=1n∑ni=1xi=1n∑cl=1nlul
类内离散度矩阵:
S(w)=∑cl=1∑i:yi=l(xi−ul)(xi−ul)T
,
d×d
矩阵。
类间离散度矩阵:
S(b)=∑cl=1nl(ul−u)(ul−u)T
,
d×d
矩阵。
目标函数
T=argminT∈Rd×rtr(TTS(w)T)tr(TTS(b)T)
,s.t.
TTS(w)T=Ir
最优解为
S(b)φ=λS(w)φ
的最大的
d
个特征值所对应的特征向量,设
定义
S(w)=12∑ni=1∑nj=1W(w)i,j(xi−xj)(xi−xj)T
定义
W(b)i,j={1n−1nl1nif yi=yj=lif yi≠yj
S(b)=12∑ni=1∑nj=1W(b)i,j(xi−xj)(xi−xj)T
FDA降维
最新推荐文章于 2022-03-10 21:26:59 发布