weixin_44156782-CSDN博客

原创【算法实践】模型融合

任务描述：用上一篇博客中评分最高的模型作为基准模型，和其他模型进行stacking融合，得到最终模型及评分果。模型融合表现最好的模型是GBDT和XGBoost。（以准确率和AUC值为判别标准）模型评估代码如下：#GBDT#训练集预测标签和概率输出train_gbdt_predict = clf_gbdt.predict(X_train)train_gbdt_predic...

2019-01-09 21:59:06 444

原创【算法实践】特征工程

数据来源https://pan.baidu.com/s/1wO9qJRjnrm8uhaSP67K0lw任务数据集是金融数据（非原始数据，已经处理过了），我们要做的是预测贷款用户是否会逾期。表格中 "status" 是结果标签：0表示未逾期，1表示逾期。特征选择：分别用IV值和随机森林进行特征选择。再用7个模型（逻辑回归、SVM、决策树、随机森林、GBD...

2019-01-07 21:55:00 470

原创【算法实践】数据预处理

数据来源https://pan.baidu.com/s/1wO9qJRjnrm8uhaSP67K0lw任务数据集是金融数据（非原始数据，已经处理过了），我们要做的是预测贷款用户是否会逾期。表格中 "status" 是结果标签：0表示未逾期，1表示逾期。数据类型转换和缺失值处理（尝试不同的填充看效果）以及及其他你能借鉴的数据探索。实现过程数...

2019-01-04 20:55:44 252

原创 Task3 模型调优

目录1.任务描述2.实现和结果对比SVM决策树LR随机森林实现：XGBLightGBM3.问题1.任务描述使用网格搜索法对7个模型进行调优（调参时采用五折交叉验证的方式），并进行模型评估，记得展示代码的运行结果。2.实现和结果对比包的导入，和数据预处理from pandas import Series,DataFrameimport p...

2018-12-24 16:21:02 329

原创 Task2 模型评估

1.任务描述记录7个模型（逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM）关于accuracy、precision，recall和F1-score、auc值的评分表格，并画出ROC曲线。2.评分方法介绍模型的‘好坏’是相对的，什么样模型是好的，不仅取决于算法和数据好决定于任务需求。性能度量反映了任务需求，在对比不同模型的能力时，不同的性能度量往往会导致不...

2018-12-22 18:26:17 248

原创【算法实践2】利用金融数据预测用户是否会逾期-（模型构建之集成模型）

任务描述构建随机森林、GBDT、XGBoost和LightGBM这4个模型，并对每一个模型进行评分，评分方式任意，例如准确度和auc值。 xgboost的安装：参考：https://blog.csdn.net/slibra_l/article/details/77500743亲测方法方便有效 lightGBM的安装： pip install lightgbm...

2018-12-20 18:00:38 359

【算法实践】利用金融数据预测用户是否会逾期欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入...

2018-12-18 16:31:34 1010

weixin_44156782的博客