clementine上的特征选择

最新推荐文章于 2022-03-12 13:29:10 发布

u012891477

最新推荐文章于 2022-03-12 13:29:10 发布

阅读量1.7k

点赞数

【转自】基于clementine的数据挖掘

clementine上的特征选择：

1. 从变量自身考察：重要的变量应该是携带信息较多，也就是变量值差异较大的变量【这个用统计上来表示，就是标准差、变异系数之类】so ,clementine的参考标准是

（1）数值型变量变异系数小于某阀值，则该变量视为不重要变量

（2）数值型变量标差小于某阀值，则该变量不重要

（3）分类型变量若某类别值的个数大于某阀值，则该变量不重要

（4）分类型变量若类别值的数量大于某阀值，则该变量不重要

2. 从输入变量和输出变量相关性角度考虑

就是计算 pearson相关系数，方差分析，卡方检验，分别对应2变量类型为数值×类别

而重要性不是相关系数的大小，而是相关系数的t检验的1-p值的大小，1-p的值越大，那么相关系数表示的相关性值越可靠，这个输入变量越重要；同理，方差分析，卡方检验，也是通过比较1-F值得到的p的值，越大表示该变量越重要

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
clementine上的特征选择

【转自】基于clementine的数据挖掘clementine上的特征选择：1. 从变量自身考察：重要的变量应该是携带信息较多，也就是变量值差异较大的变量【这个用统计上来表示，就是标准差、变异系数之类】so ,clementine的参考标准是（1）数值型变量变异系数小于某阀值，则该变量视为不重要变量（2）数值型变量标差小于某阀值，则该变量不重要（3）分类型变量若某类别值的个
复制链接

扫一扫

u012891477 CSDN认证博客专家 CSDN认证企业博客

码龄11年

49: 原创

14万+: 周排名

84万+: 总排名

10万+: 访问

: 等级

1542: 积分

12: 粉丝

13: 获赞

11: 评论

81: 收藏

私信

关注

热门文章

分类专栏

python 6篇

最新评论

r 语言里拟合函数的参数估计
m0_70368760: 我想请问一下微分方程怎么用R语言拟合呢？
r 语言里拟合函数的参数估计
u012891477: 我本地测试语法是通过的，你这边无限循环会不会是数据和待拟合的方程比较特殊导致无解，或者迭代趋于振荡
r 语言里拟合函数的参数估计
qq_48529381: 您好，我在使用时总是报错，循环次数超过50，改大了之后还是不行，想问您一下nls函数真的可以标定多个参数吗，我为什么感觉像是无限循环一样。期待您的回复！
【微信小编】动态地图gif制作
Fuihih: 请问还有源码吗？我做的时候，添加了时间轴，原本的地图就没了
MDS图示聚类结果
u012891477 回复 m0_49328324: 是原始文件里面每行数据对应的分类，是已知的

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。