【秋招基础知识】【1】特征降维方法 PCA+LDA

一、主成分分析PCA(Principal Component Analysis)

  • PCA是一种无监督特征降维方法(也可以认为是特征提取方法,从高维提取出低位),在降维的同时保留尽可能多的信息。
  • PCA的目标是让样本之间的方差(衡量样本分散的程度)尽可能大(分散能够防止几个点投影至同一个点的情况)。
  • PCA的执行步骤:
    给定n个d维样本xi,想要将维度降到k。
    1.将原始数据按行组合成n*d矩阵。
    2.将所有样本特征中心化,转化为均值为0。
    3.计算样本的协方差矩阵Cov=XXT。
    4.求出协方差矩阵的特征值及对应的特征向量。
    5.将特征值从大到小进行排序,然后选取前边的k个特征值对应的特征向量,作为线性变换矩阵P(维度k*d)。
    6.Y=XP即降维到k维。
  • 倘若d维特征在k维线性不可分,直观上先升维至线性可分再降维,实际上使用核函数来模拟这一过程。
    在这里插入图片描述

二、线性判别模型_隐式狄利克雷分布LDA(Latent Dirichlet Allocation)

LDA是一种有监督降维方法,它的目标是同一组内方差尽可能小,组间方差尽可能地大。
在这里插入图片描述

PCA和LDA的比较

在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值