Day Three——使用sklearn和Keras训练模型可视化
第一部分数据bankloan.xls
第二部分数据sales_data.xls
第三部分数据sales_data.xls
第四部分数据consumption_data.xls
第五部分数据consumption_data.xls
第六部分数据arima_data.xls
第七部分数据consumption_data.xls
第八部分数据menu_orders.xls
第一部分——随机森林(RLR)求有效特征,逻辑回归(LR)求相关系数
对应函数programmer_1
步骤:
导入数据,转换矩阵
调包。
from sklearn.linear_model import LogisticRegression as LR
逻辑回归,from sklearn.linear_model import RandomizedLogisticRegression as RLR
随机森林输出有效特征、输出相关系数
这里在运行的时候,会有一个warning
。大意说,这个方法在之后会被取消。但是目前我没有找到替代的方法。
DeprecationWarning: Class RandomizedLogisticRegression is deprecated; The class RandomizedLogisticRegression is deprecated in 0.19 and will be removed in 0.21.
有一个Error
,解决方法就是去掉最后一列再进行索引。data.drop('违约', axis=1).columns[rlr_support]
IndexError: boolean index did not match indexed array along dimension 0; dimension is 9 but corresponding boolean dimension