南瓜书第三章\线性判别分析

算法思想

线性判别分析一种经典的线性学习方法,适用于二分类问题。算法思想是:将给定样例投影到一条直线上,使得同类样本投影点尽可能相近,即同类样本方差小,异类样本投影点尽可能远离,即异类样本中心尽可能远离。

参数估计

给定数据集D={(x_i,y_i)}_{i=1}^my_i\in \left \{ 0,1 \right \},令Xi、μi、Σi分别表示第i∈{0,1}类示例的集合、均值向量、协方差矩阵,即\sum_{i}=\sum_{x\in X_0}(x-\mu _i)(x-\mu_i)^T。若将数据投影到直线w上,则两类样本的中心在直线上的投影分别为w^T\mu _0w^T\mu _1,两类样本的协方差分别为w^T\sum_{0}ww^T\sum_{1}w

若同类样本方差尽可能小,则w^T\sum_{0}w+w^T\sum_{1}w尽可能小;若异类样本中心尽可能远离,则\left \| w^T\mu _0-w^T\mu _1 \right \|_2^2尽可能大。所以综合得到,

J=\frac{\left \| w^T\mu _0-w^T\mu _1 \right \|_2^2}{w^T\sum_{0}w+w^T\sum_{1}w}

尽可能大。变换得,

J=\frac{w^T(\mu_0-\mu_1)(\mu_0-\mu_1)^Tw}{w^T(\sum_{0}+\sum_1)w}

令,

S_w=\sum_0+\sum_1

S_b=(\mu_0-\mu_1)(\mu_0-\mu_1)^T

我们称S_w为“类内散度矩阵”,S_b为“类间散度矩阵”。

则,

J=\frac{w^TS_b w}{w^TS_w w}

此为最大化目标,也是S_w相对于S_b的广义瑞利商。

我们可以用“拉格朗日乘子法”求w^*

因为我们不关心w的大小,只关心其方向,所以可以令分母为1,即w^TS_w w为1.则式子等价于,

min_w -w^TS_b w

s.t.    w^TS_w w=1

构建拉格朗日函数,L(w,\lambda )=-w^TS_b w+\lambda (w^TS_w w-1).

对w求偏导,\frac{\partial L(w,\lambda)}{\partial w}=-2S_bw+2\lambda S_w w.

令上式为0,(\mu_0-\mu_1)(\mu_0-\mu_1)^Tw=\lambda S_w w.

(\mu_0-\mu_1)^Tw为实数,由于我们不关心w的大小,所以可以令(\mu_0-\mu_1)^Tw=\lambda,同时也不用约束条件w^TS_w w-1=0,则得到w=S_w^{-1}(\mu_0-\mu_1).

还可以把LDA推广到多分类任务中,定义“全局散度矩阵”

S_t=S_b+S_w

S_t=\sum_{i=1}^m(x_i-\mu)(x_i-\mu)^T.

可以使用S_tS_bS_w中的任意两个来实现多分类LDA.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值