数据挖掘项目
ZoeHwang_
不务正业的程序员
知乎:ZoeHuang
B站:ZoeHwang_
微信公众号:ZoeHwang
展开
-
Task1.2 模型构建之集成模型
构建随机森林、GBDT、XGBoost和LightGBM这4个模型,并对每一个模型进行评分 # install the package in jupyter notebook !pip install xgboost !pip install lightgbm import pandas as pd import numpy as np from sklearn.model_selection ...原创 2018-12-20 11:16:07 · 283 阅读 · 0 评论 -
Task2 模型评估
记录7个模型(逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线。 (时间太紧了直接上代码了嘤嘤) import pandas as pd import numpy as np from sklearn.model_selection import train...原创 2018-12-22 14:35:52 · 221 阅读 · 0 评论 -
预测贷款用户是否会逾期
数据信息: 这是本次实践数据的下载地址 https://pan.baidu.com/s/1dtHJiV6zMbf_fWPi-dZ95g 说明:这份数据集是金融数据(非原始数据,已经处理过了),要做的是预测贷款用户是否会逾期。表格中 “status” 是结果标签:0表示未逾期,1表示逾期。 任务1.1 - 模型构建 将金融数据集三七分 随机种子2018 调用sklearn的包,简单构建逻辑回归、S...原创 2018-12-18 20:25:33 · 1470 阅读 · 0 评论 -
Task3 模型调优
使用网格搜索法对7个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估 import pandas as pd import numpy as np from sklearn.model_selection import GridSearchCV from sklearn.model_selection import train_test_split from sklearn.svm i...原创 2018-12-24 21:48:36 · 191 阅读 · 0 评论 -
金融贷款预测
数据预处理 说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 “status” 是结果标签:0表示未逾期,1表示逾期。 import pandas as pd from sklearn.model_selection import train_test_split financial = pd.read_csv("data.csv", encod...原创 2019-01-04 21:52:27 · 852 阅读 · 0 评论 -
金融贷款
任务:分别用IV值和随机森林进行特征选择。然后分别构建模型(逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM),进行模型评估。 用IV值进行特征选择: import pandas as pd from pandas import DataFrame as df from numpy import log import numpy as np financial = ...原创 2019-01-07 21:59:21 · 430 阅读 · 0 评论 -
金融预测
一周算法实践进阶day3:模型融合 import pandas as pd from sklearn.model_selection import train_test_split import numpy as np from sklearn.preprocessing import StandardScaler from sklearn.linear_model import Logistic...原创 2019-01-09 21:29:47 · 588 阅读 · 0 评论