降维中的特征选择

在建模中第一步就是特征处理,之前用spss modeler这种集成好的软件,没有处理过维度很高的数据,上来就是数据各种图形、缺失值、噪声处理,这次接触到上千个维度,数据看了下倒是没有缺失值,用r去做逻辑回归,但是总是报错,后来发现是模型迭代次数太少,模型不稳定,需要调节参数control=list(maxit=100),但是运行很慢很慢,因此想先降低维度再建立模型吧,但是网上和书本上都是讲解各种算法的案例,很少有特征处理的,上次翻译的维度灾难文章,光说了维度灾难带来的害处,有一篇是用pca方法降低维度的,但是后来想想自己的数据集中既有连续性变量又有类别型变量。pca用的是相关矩阵,对于连续类型变量很适合,要是对于类别型例如二分类,自己还是没有把握能不能用,搜索了好久,终于找到这篇带有操作意义的参考:1点击打开链接2  点击打开链接


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值