降维算法:线性判别分析LDA

降维算法:线性判别分析LDA

祺哥让我做的笔记……

1.背景介绍

  • 用途:用作数据预处理中的降维。

    (为什么要降维?当样本个数多、特征个数多时,计算、调参和评估时候效率会很低;而且不一定所有的特征都有用,所以仅保留重要的信息进行建模)

  • 历史:Ronald A.Fisher 于1936提出的线性判别分析方法

  • 目标:最大化类间区分度的坐标轴成分,即将特征空间(数据集中的多维样本)投影到一个维度更小的K维子空间中,同时保持区分类别的信息。

  • 原理:投影到维度更低的空间中,使得投影后的点,会形成按类别区分。

  • 难点和核心点:如何找投影?即更合适分类的空间。

  • 与PCA区别LDA更关心分类而不是方差;LDA是有监督问题,PCA是无监督的问题。

2.数学原理:

2.1目标:

  • 找到该投影 y=wTx
  • 使不同类别之间的距离越远越好,同一类别之中的距离越近越好
  • 每类别的均值 μi=1/Nixwix
  • 投影后的均值 μ˜i=1/Niywiy=1/NixwiwTx=wTμi
  • 投影后的两类样本中心点尽量分离
    J(w)=|μ˜1μ˜2|=wT(μ1μ2)

只要J(w)越大就可以了吗?如下图: μ1

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值