线性判别分类器LDA

最新推荐文章于 2024-03-28 19:04:18 发布

DerekLiv

最新推荐文章于 2024-03-28 19:04:18 发布

阅读量1.1k

点赞数

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/NewBattleUser/article/details/110186317

版权

LDA线性判别分类器

线性判别分类器由向量 $w$ 和偏差项 $b$ 构成。给定样例 $x$ ，其按照如下规则预测获得类别标记 $y$ ，即
$y=sign(w^Tx+b)$
后面统一使用小写表示列向量，转置表示行向量。
分类过程分为如下两步：

首先，使用权重向量w将样本空间投影到直线上去
然后，寻找直线上一个点把正样本和负样本分开。

为了寻找最有的线性分类器，即 $w$ 和 $b$ ，一个经典的学习算法是线性判别分析（Fisher’s Linear Discriminant Analysis，LDA）。

简要来说，LDA的基本想法是使不同的样本尽量原理，使同类样本尽量靠近。

这一目标可以通过扩大不同类样本的类中心距离，同时缩小每个类的类内方差来实现。

在一个二分类数据集上，分别记所有正样本的的均值为 $\mu_+$ ，协方差矩阵为 $\Sigma_+$ ；所有负样本的的均值为 $\mu_-$ ，协方差矩阵为 $\Sigma_-$ 。

类间距离

投影后的类中心间距离为正类中心的投影点值减去负类投影点值：
$S_B(w)=(w^T\mu_+-w^T\mu_-)^2$

类内距离

同时，类内方差可写为：
$S_W(w)=\frac{\sum_x(w^Tx_i-w^T\mu_+)^2+\sum_x(w^Tx_i-w^T\mu_-)^2}{n-1}$

$=\frac{\sum_x(w^T(x_i-\mu_+))^2+\sum_x(w^T(x_i-\mu_-))^2}{n-1}$

$=\frac{\sum_xw^T(x_i-\mu_+)(w^T(x_i-\mu_+))^T+\sum_xw^T(x_i-\mu_-)(w^T(x_i-\mu_-))^T}{n-1}$

$=\frac{w^T\sum_x(x_i-\mu_+)(x_i-\mu_+)^Tw+w^T\sum_x(x_i-\mu_-)(x_i-\mu_-)^Tw}{n-1}$

其中
$\frac{\sum_x(x_i-\mu_+)(x_i-\mu_+)^T}{n-1} = \Sigma_+$
是正类的协方差矩阵，注意
$x(x_i-\mu_+)$
是列向量，所以协方差是一个长宽等于数据维度的方阵。

最后：

$S_W(w)=w^T\Sigma_+w+w^T\Sigma_-w$

优化目标

线性判别式的总目标就是最大化类间距离，最小化类内方差，类似于聚类：

$\mathop{\arg\max}\limits_{w} J(w) = \frac{S_B(w)}{S_W(w)}$

$=\frac{(w^T\mu_+-w^T\mu_-)^2}{w^T\Sigma_+w+w^T\Sigma_-w}$

$\frac{w^T(\mu_+-\mu_-)(w^T(\mu_+-\mu_-))^T}{w^T(\Sigma_+-\Sigma_-)w}$

$\frac{w^T(\mu_+-\mu_-)(\mu_+-\mu_-)^Tw}{w^T(\Sigma_+-\Sigma_-)w}$

看到这个形式，我们根据上一篇文档的知识知道这个可以使用广义瑞利商来求极大值。

广义瑞利商

**背景介绍及推导见(瑞利商（Rayleigh quotient）与广义瑞利商（genralized Rayleigh quotient）
**
下面只摘抄一些：

广义瑞利商是指这样的函数 $R (A, B, x)$ :
$\cfrac{X^{H}Ax}{X^{H}Bx}$
其中𝑥为非零向量，而𝐴,𝐵为 $n \times n$ 的Hermitan矩阵。𝐵为正定矩阵。

令
$A=(\mu_+-\mu_-)(\mu_+-\mu_-)^T$

$\Sigma_+-\Sigma_-$

$\mathop{\arg\max}\limits_{w} J(w) = \frac{w^TAw}{w^TBw}$

这个就很广义瑞利商了。

至于w的值，使用拉格朗日乘子法可以求解得到：

$B^{-1}Aw = \lambda w$

$B^{-1}(\mu_+-\mu_-)(\mu_+-\mu_-)^Tw = \lambda w$

由于
$(\mu_+-\mu_-)^Tw$
是行向量乘列向量，所以结果是一个标量，
那我们知道：
$B^{-1}(\mu_+-\mu_-) \propto \lambda w$

$(\Sigma_+-\Sigma_-)^{-1}(\mu_+-\mu_-) \propto w$

由于w我们只关注方向而不是长度，所以可以认为：

$w_{best} =(\Sigma_+-\Sigma_-)^{-1}(\mu_+-\mu_-)$

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
线性判别分类器LDA

LDA线性判别分类器线性判别分类器由向量www和偏差项bbb构成。给定样例xxx，其按照如下规则预测获得类别标记yyy，即y=sign(wTx+b)y=sign(w^Tx+b)y=sign(wTx+b)后面统一使用小写表示列向量，转置表示行向量。分类过程分为如下两步：首先，使用权重向量w将样本空间投影到直线上去然后，寻找直线上一个点把正样本和负样本分开。为了寻找最有的线性分类器，即www和bbb，一个经典的学习算法是线性判别分析（Fisher’s Linear Discriminant A
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。