稀疏变量的处理

最新推荐文章于 2024-01-11 01:11:20 发布

J_sir2015

最新推荐文章于 2024-01-11 01:11:20 发布

阅读量2k

点赞数 1

分类专栏： R

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/J_sir2015/article/details/81507559

版权

R 专栏收录该内容

19 篇文章 1 订阅

订阅专栏

经常，对于高维的数据集，降维的第一步，就是删除那些包含相同信息的变量，就是变量取值很多相同的或者改变了的方差很小。

想删除第一步，就是，先问为什么？

当然是模型不接受你这种的变量，好比如回归分析，把很多值相同的变量作为自变量，对于模型的拟合效果有影响。

那么，要删，当然先找到哪些属于稀疏变量。

nearZeroVar为caret包中函数的两个参数就是理论。

1.uniqueCut:是不同取值数目和样本量的比值，freqCut:是最常见的取值频数和第二常见的取值频数之间的比值

该函数返回的结果是：数据集中稀疏变量所在的各列。

同样可以通过单变量可视化来判断，进而剔除。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

J_sir2015 CSDN认证博客专家 CSDN认证企业博客

码龄7年

40: 原创

7万+: 周排名

100万+: 总排名

21万+: 访问

: 等级

1940: 积分

62: 粉丝

75: 获赞

22: 评论

430: 收藏

私信

关注

分类专栏

SAS 宏变量&宏函数
随想 1篇
SAS 4篇
d
y
R 19篇
SAS 18篇
sql 5篇

最新评论

主成分分析应用之主成分回归
富士山终究留不住欲落的樱花。: 博主您好，所以，以前三个主成分的得分值作其观测值z1，z2，z3，并把它添加到数据集OXY中，建立回归模型： y =46.3800+2.0593*z1 -1.4782*z2 +0.6950*z3这个地方我思考了很久不知道是怎么求出来的。如果有时间的话可以回复我吗
主成分分析应用之主成分回归
Wwwum: 我认为这里应是有误的，主成分是对自变量的一种降低共线性和降维的操作。
主成分分析应用之主成分回归
buaazxwjx: 你好，该博主中提取主成分z中包含因变量y，但主成分分析主要是从自变量中提取，然后用主成分z和因变量y进行多元线性回归，请问是这样的吗？是不是博主分析出现了问题。
主成分分析应用之主成分回归
buaazxwjx: 博主你好，在获取主成分时，为什么要把y作为其中的一个指标，而不是直接从x1~x6提取三个主成分？而是把y加进去后获得三个主成分？
主成分分析应用之主成分回归
黎曼最初的梦想: 你好！请问在逆变换法中求coef最后为什么要除标准差啊？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。