Fisher线性判别散度矩阵Sb,Sw 另一种表达形式的证明

Fisher线性判别中散度矩阵的表现形式可以改写,类内散度:

Sw=i=1cj:yj=i(xjμi)(xjμi)T=12i,jA(w)ij(xixj)(xixj)T S w = ∑ i = 1 c ∑ j : y j = i ( x j − μ i ) ( x j − μ i ) T = 1 2 ∑ i , j A i j ( w ) ( x i − x j ) ( x i − x j ) T

其中, μi=1nij:yj=ixj μ i = 1 n i ∑ j : y j = i x j
A(w)ij={1nk,0,if yi=yj=kif yiyj A i j ( w ) = { 1 n k , if  y i = y j = k 0 , if  y i ≠ y j

而类间散度为:
Sb=i=1cni(μiμ)(μiμ))T=12i,jnA(b)ij(xixj)(xixj)T S b = ∑ i = 1 c n i ( μ i − μ ) ( μ i − μ ) ) T = 1 2 ∑ i , j n A i j ( b ) ( x i − x j ) ( x i − x j ) T

其中,
μ=1ni=1nxj μ = 1 n ∑ i = 1 n x j

A(b)ij={1n1nk,1n,if yi=yj=kif yiyj A i j ( b ) = { 1 n − 1 n k , if  y i = y j = k 1 n , if  y i ≠ y j

证明过程如下。
首先证明类内散度 Sw S w


这里写图片描述

而对于另一种表达:

这里写图片描述

因此,有公式(1)和(2)可知,两者相等,那么类内散度矩阵 Sw S w 的改写得证!
接下来证明类内散度矩阵:

这里写图片描述

而对于另一种表达:

这里写图片描述

而公式(4)的前半部分为:

这里写图片描述

而公式(4)的后半部分为:

这里写图片描述

那么,根据公式(3)(5)(6)则有

这里写图片描述

那么,根据公式(3)(7)可知,两公式相等,也即得证。
而在论文 M. Sugiyama, Local Fisher Discriminant Analysis for Supervised Dimensionality Reduction, ICML, 2006也对这个问题进行了阐述和证明。在该论文中,是直接由通常的一般式推导至改写式,证明过程为:

这里写图片描述


这里写图片描述


这里写图片描述

证明中同样用到了 xixj x i 和 x j 的等价性。

### 回答1: Fisher线性判别在解决两类的线性判别问题时第一步是确定两类数据的均值向量,即每一类数据的平均值向量。这个均值向量可以看作是整个类别的代表,因此计算均值向量是Fisher线性判别的第一步。通过计算两个类别的均值向量之间的距离,可以初步判断两个类别之间是否存在可分性。如果两个类别之间的均值向量距离越大,则两个类别之间的可分性就越好。 ### 回答2: Fisher线性判别一种经典的线性判别方法,用于解决两类的线性判别问题。在进行Fisher线性判别时,第一步是确定判别准则。 判别准则是根据两类样本的分布情况,通过某种准则对两类样本进行判别决策的方法。Fisher线性判别的目标是找到一个判别准则,使得两类样本之间的距离尽可能大,同类样本之间的距离尽可能小。 具体来说,Fisher线性判别的第一步是计算两类样本的均值向量。对于每一个类别,通过计算该类样本的特征向量的均值,可以得到一个代表该类的均值向量。 接下来,计算两个均值向量之间的差异度量,即类间散度矩阵类间散度矩阵可以通过将两个均值向量的差向量进行转置并乘以差向量的转置来计算得到。 然后,计算类内散度矩阵类内散度矩阵衡量的是同一类别样本之间的差异度量,可以通过计算每个类别样本特征向量与其均值向量的差向量的转置乘以差向量的形式得到。 最后,通过计算类内散度矩阵的逆矩阵类间散度矩阵的乘积,可以得到Fisher判别准则的最佳投影方向,也称为Fisher判别向量。 在确定Fisher线性判别判别准则之后,接下来的步骤是计算将样本投影到该方向上的投影值,并根据阈值来进行判别决策,将样本划分到不同的类别中。 总之,Fisher线性判别在解决两类的线性判别问题时的第一步是通过计算类间散度矩阵类内散度矩阵来确定判别准则,即Fisher判别向量。 ### 回答3: Fisher线性判别一种经典的线性判别方法,用于解决两类的线性判别问题,它的第一步是确定一个能够将两类样本最好地分开的线性投影方向。 具体来说,Fisher线性判别的第一步是计算两类样本之间的类内散度矩阵(Sw)和类间散度矩阵(Sb)。类内散度矩阵衡量了同一类样本之间的差异程度,而类间散度矩阵则衡量了不同类之间的差异程度。 然后,通过计算将样本投影到一维空间后,类内散度类间散度的比值最大化。这个比值被称为Fisher准则函数,用于衡量投影后的样本在临界点的分离程度。 最后,根据Fisher准则函数的最大化,我们可以得到一个最佳的线性投影方向,即Fisher线性判别的第一步。 这个最佳的线性投影方向可以通过求解SbSw的广义特征值问题来得到。在求解过程中,我们需要对类内散度矩阵Sb进行奇异值分解,然后将得到的特征向量按照特征值降序排列,选择前k个最大的特征向量作为投影方向。 总之,Fisher线性判别在解决两类的线性判别问题时的第一步是确定一个最佳的线性投影方向,通过最大化类间散度类内散度的比值来实现。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值