Fisher判别

最新推荐文章于 2024-06-04 07:30:00 发布

ILES

最新推荐文章于 2024-06-04 07:30:00 发布

阅读量7.9k

点赞数 2

分类专栏：数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43913556/article/details/105373050

版权

数据挖掘专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

距离判别法

距离判别法首先根据已知分类的数据，分别计算出各类的重心。再根据新个体到每类的距离（即新个体与各类重心的距离，可采用欧氏距离或者马氏距离等等），根据最短的距离确定分类情况。
问题描述：
在这里插入图片描述

欧氏距离

在这里插入图片描述
Note: 第一个等式是矩阵的写法。

马氏距离

在这里插入图片描述

Note: 矩阵的写法。

关于协方差矩阵

在这里插入图片描述

协方差矩阵：对n个维度，任意两个维度都计算一个协方差，组成矩阵

具体见协方差矩阵

Fisher判别分析

应用步骤：

把来自2类的训练样本集划分为2个子集 $X_1,X_2, i=1,2$
计算各类的均值向量 $m_1,m_2$ （投影前）
得到投影后均值向量 $\mu_1,\mu_2$
计算各类的类内离散度矩阵 $S_i$ （投影前）
计算投影之后的离散度矩阵 $\sigma_i^2$
计算类内总离散矩阵 $S_t$
求出 $w_{op}=S_t^{-1}(m_1-m_2)$
$y=w_{op}^Tx$
确定阈值 $w_0$ 比较 $y$ 值与阈值 $w_0$ 的大小，得出其分类。

核心思想

Fisher判别的基本思想：
希望投影后的一维数据满足：

两类之间的距离尽可能远； 
每一类自身尽可能紧凑。

具体步骤解释

Fisher准则函数：

在这里插入图片描述

我们的目标是求出 $y=w^Tx$ 这条直线。因此求 $w$
所以我们投影降维，将均差、离散度写成有关 $w$ 的函数。
我们希望类间距大，类内小；所以，目标求 $w$ 为多少时，式子达到最大值。

投影降维

给定训练样例集，设法将样例投影到一条直线上，使得同类样例的投影点尽可能接近、不同类样例的投影点尽可能远离。在对新样本进行分类时，将其投影到同样的这条直线上，再根据新样本投影点的位置来确定它的类别
在这里插入图片描述

$y=w^Tx$ 就是要投影到的直线

组间偏差

$(\mu_1-\mu_2)^2=(w^Tm_2-w^Tm_1)^2$
将原始空间的均值m1，m2投影后( $\mu_1=w^Tm_1$ )得到在直线上的 $\mu_1$ 和 $\mu_2$

组内偏差

按照方差分析里的思想，应该把各组内的偏差相加，再把各组的偏差总和相加。
在这里插入图片描述

离散度矩阵定义为：
在这里插入图片描述
各组内的偏差相加： 样本与均值差距

因此， $J_F(w)$ 下面的式子：
$\sigma_1^2+\sigma_2^2=w^TS_1w+w^TS_2w=w^T(S_1+S_2)w$

各组的偏差总和相加
在这里插入图片描述

求出最优解

最大化上述式子得到当前 $w_{op}$
在这里插入图片描述

关注

2
点赞
踩
48

收藏

觉得还不错? 一键收藏
1
评论
Fisher判别

文章目录距离判别法欧氏距离马氏距离关于协方差矩阵Fisher判别分析应用步骤：核心思想具体步骤解释Fisher准则函数：投影降维组间偏差组内偏差求出最优解距离判别法距离判别法首先根据已知分类的数据，分别计算出各类的重心。再根据新个体到每类的距离（即新个体与各类重心的距离，可采用欧氏距离或者马氏距离等等），根据最短的距离确定分类情况。问题描述：欧氏距离Note: 第一个等式是矩阵的写法...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。