linear_model线性回归模型步骤
模型和数据导入
特征选择
特征归一化处理
模型策略(经验风险最小化,结构风险最小化,损失函数,正则化)
模型训练(交叉验证法)
模型预测
模块导入
特征选择
特征选择:提取主要特征,减少数据冗长重复,有模块直接使用
策略:
1.低方差阈值(VarianceThreshold)
2.单变量特征选择(selectKbest、selectpercentile)
For regression: f_regression, mutual_info_regression
For classification: chi2, f_classif, mutual_info_classif