在建模中第一步就是特征处理,之前用spss modeler这种集成好的软件,没有处理过维度很高的数据,上来就是数据各种图形、缺失值、噪声处理,这次接触到上千个维度,数据看了下倒是没有缺失值,用r去做逻辑回归,但是总是报错,后来发现是模型迭代次数太少,模型不稳定,需要调节参数control=list(maxit=100),但是运行很慢很慢,因此想先降低维度再建立模型吧,但是网上和书本上都是讲解各种算法的案例,很少有特征处理的,上次翻译的维度灾难文章,光说了维度灾难带来的害处,有一篇是用pca方法降低维度的,但是后来想想自己的数据集中既有连续性变量又有类别型变量。pca用的是相关矩阵,对于连续类型变量很适合,要是对于类别型例如二分类,自己还是没有把握能不能用,搜索了好久,终于找到这篇带有操作意义的参考:1点击打开链接2 点击打开链接