今天主要是对于特征选择、降维方法、集成方法、做了较多的讲解。
1.机器学习中做特征选择时,可能用到的方法有?
A.卡方
B. 信息增益
C. 平均互信息
D. 期望交叉熵
E. 以上都有
参考答案:E
解析:特征选择是机器学习框架中的比较重要的一环,可以说是仅次于模型选择。上面4种是常用的文本数据的特征选择方法,还有文档频率和文本证据权(WET)等。但是除去文本的特征选择方法,还有其他类型的特征选择方法:
- WOE、IV
- Gini指数
- 相关性
- Lasso
- 距离
- 正则化
等等,结合SKlearn,详细的可以参考《SKlearn特征选择实例》。
- 下列方法中,不可以用于特征降维的方法包括()
A. 主成分分析PCA
B. 线性判别分析LDA
C. 深度学习SparseAutoEncoder
D. 矩阵奇异值分解SVD
E. 最小二乘法LeastSquares