降维

最新推荐文章于 2020-06-18 09:42:26 发布

cf_wu95

最新推荐文章于 2020-06-18 09:42:26 发布

阅读量138

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cf_wu95/article/details/89883080

版权

机器学习专栏收录该内容

16 篇文章 1 订阅

订阅专栏

PCA

判断降维维数：在判断降维的维数时，可以通过np.cumsum(var_exp)来判断要降多少维，var_exp表示排好序的特征值。求得的list表示前n个特征值的重要程度之和

目的：投影后的投影的值尽可能分散，方差尽可能大。

优化目标：将一组N维向量降为K维（K大于0，小于N），目标是选择K个单位正交基，使原始数据变换到这组基上后，各字段两两间协方差为0，字段的方差则尽可能大

1.寻找一个一维基，使得所有数据变换为这个基上的坐标表示后，方差值最大

2.选择第二个基时只能在与第一个基正交的方向上选择

具体方法：

1.协方差矩阵对角化：即除对角线外的其它元素化为0，并且在对角线上将元素按大小从上到下排列。

2.根据特征值的从大到小，将特征向量从上到下排列，则用前K行（前K重要（数值最大）的特征值所对应的特征向量）组成的矩阵乘以原始数据矩阵X，就得到了我们需要的降维后的数据矩阵Y。

优点：

1.使样本的采样密度增大

2.较小的特征值所对应的特征向量往往与噪声有关，舍弃他们一定程度上能起到去燥的效果。

LDA

LDA关心的是能够最大化类间区分度的坐标轴成分，将特征空间（数据集中的多维样本）投影到一个维度更小的k 维子空间中，
同时保持区分类别的信息。求出最佳投影方向w，w即为最大特征值所对应的特征向量,同PCA。

目的，原理：投影到维度更低的空间中，使得投影后的点，会形成按类别区分，一簇一簇的情况，相同类别的点，将会在投影后的空间中更接近方法

PCA和LDA的相同点

PCA和LDA都是经典的降维算法；
PCA和LDA都假设数据是符合高斯分布的；
PCA和LDA都利用了矩阵特征分解的思想。

PCA和LDA的不同点

PCA是无监督（训练样本无标签）的，LDA是有监督（训练样本有标签）的；
PCA是去掉原始数据冗余的维度，使投影后的投影的值尽可能分散，方差尽可能大，LDA是选择一个最佳的投影方向，使得投影后相同类别的数据分布紧凑，不同类别的数据尽量相互远离。
LDA最多可以降到k-1维（k是训练样本的类别数量，k-1是因为最后一维的均值可以由前面的k-1维的均值表示）；
LDA可能会过拟合数据。

注意点：

1.原则意义上类别变量（离散型）是不能用于做因子分析（PCA）的，只有连续变量才行。可以把连续型变量做因子分析(PCA)，再和分类变量放到一起。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
降维

PCA判断降维维数：在判断降维的维数时，可以通过np.cumsum(var_exp)来判断要降多少维，var_exp表示排好序的特征值。求得的list表示前n个特征值的重要程度之和目的：投影后的投影的值尽可能分散，方差尽可能大。优化目标：将一组N维向量降为K维（K大于0，小于N），目标是选择K个单位正交基，使原始数据变换到这组基上后，各字段两两间协方差为0，字段的方差则尽可能大1....
复制链接

扫一扫

专栏目录

cf_wu95 CSDN认证博客专家 CSDN认证企业博客

码龄7年

50: 原创

8万+: 周排名

148万+: 总排名

8万+: 访问

: 等级

1063: 积分

12: 粉丝

39: 获赞

15: 评论

142: 收藏

私信

关注

热门文章

分类专栏

最新评论

Ubuntu 切换系统默认启动内核
MMI码农: 解决了我的问题，给你点赞
Linux下Python脚本与Shell脚本的使用区别
普通网友: 老师好，一直有关注老师的文章，内容非常好，也解决了很多我工作上的问题。我也非常想认识老师，不知道老师是否有线上的联系方式。能方便留个您的联系方式么？我的微信cto51shequ，期待老师的回复～
林子雨hive实践教程错误笔记
Kebreros的乌龙玛奇朵: 感谢233我也在做这个作业
Ubuntu 切换系统默认启动内核
最早的早安227: 嘻嘻写的不错
Ubuntu 切换系统默认启动内核
最早的早安227: 嘿嘿

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。