Fisher算法
Fisher算法是对线性可分问题的非迭代解法,其将高维特征空间中的样本投影到一条直线上,实现从高维到一维的数据压缩。如果在投影后的直线上训练样本具有很好的分布,则可以通过简单操作实现对输入样本的分类
X = { X 1 , X 2 , . . . , X N } = { X 1 , X 2 , . . . , X n i ∈ ω i X n i + 1 , X n i + 2 , . . . , X N ∈ ω j \mathcal{X}=\{X_1,X_2,...,X_N\}=\left\{ \begin{aligned} X_1,X_2,...,X_{n_i} \in \omega_i \\ X_{n_i+1},X_{n_i+2},...,X_N \in \omega_j \end{aligned} \right. X={
X1,X2,...,XN}={
X1,X2,...,Xni∈ωiXni+1,Xni+2,...,XN∈ωj
X k , k = 1 , 2 , . . . , N X_k,k=1,2,...,N Xk,k=1,2,...,N在 W W W方向上的投影为
y k = W T X k , k = 1 , 2 , . . . , N y_k=W^TX_k,k=1,2,...,N yk=WTXk,k=1,2,...,N
为获取最佳投影方向,我们引入准则函数。在此之前,先介绍两个概念:
- 类间距:不同类别样本均值的差别应尽可能大
- 类内距:相同类别样本均值的方差应尽可能小
m y l = 1 n l ∑ y k ∈ ω l W T X k = W T ( 1 n l ∑ X k ∈ ω l X k ) = W T m x l , l = i , j m_y^l=\frac{1}{n_l}\sum\limits_{y_k \in \omega_l}W^TX_k=W^T(\frac{1}{n_l}\sum\limits_{X_k \in \omega_l}X_k)=W^Tm_x^l, l=i,j myl=nl1yk∈ωl∑WTXk=WT(nl1Xk∈ωl∑Xk)=WTmxl,l=