天池项目笔记-金融风控-贷款违约预测 Task4

最新推荐文章于 2021-05-05 20:46:08 发布

JADQ

最新推荐文章于 2021-05-05 20:46:08 发布

阅读量681

点赞数

分类专栏：天池数据比赛文章标签：机器学习 python 深度学习

本文链接：https://blog.csdn.net/qq_34080297/article/details/108784106

版权

天池同时被 2 个专栏收录

4 篇文章

订阅专栏

数据比赛

4 篇文章

订阅专栏

该博客介绍了如何使用XGBoost、LightGBM和随机森林进行信用违约预测，并通过AUC评分进行模型验证。作者首先划分数据集，然后构建了三个模型的训练函数。接着，分别用XGBoost和LightGBM进行预测，计算AUC分数。最后，通过加权AUC实现了模型集成，得到0.7303的AUC得分，在排行榜上位列第88名。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Task04_建模与调参 modeling and tuning

尝试使用LightGBM、Xgboost和Random Forest三种树模型进行预测和集成

1.划分数据集

X_data = train_data[feature_columns]
Y_data = train_data['isDefault']
X_test = test_data[feature_columns]

from sklearn.model_selection import train_test_split
from sklearn.metrics import roc_auc_score
#data 划分
x_train, x_val, y_train, y_val = train_test_split(X_data, Y_data, test_size = 0.2)
#x_train, x_val, y_train, y_val = train_test_split(X_data, np.log(Y_data), test_size = 0.2)

2.打包模型使用的函数

import xgboost as xgb
def build_model_xgb(x_train, y_train):
    model = xgb.XGBRegressor(n_estimators = 150, learning_rate = 0.1, gama = 0, max_depth = 7)
    model.fit(x_train, y_train)
    return model

import lightgbm as lgb
def build_model_lgb(x_train, y_train):
    model = lgb.LGBMRegressor(n_estimator = 150, num_leaves = 127, learning_rate = 0.1)
    model.fit(x_train, y_train)
    return model

from sklearn.ensemble import RandomForestRegressor
def build_model_rf(x_train, y_train):
    model = RandomForestRegressor(n_estimators = 150, max_depth = 6, max_features = 'sqrt', criterion = 'mae')
    model.fit(x_train, y_train)
    return model

3.使用xgboost进行预测

model_xgb = build_model_xgb(x_train, y_train)
val_xgb = model_xgb.predict(x_val)
AUC_xgb = roc_auc_score(y_val, val_xgb)
print('xgboost validation AUC', AUC_xgb)

model_xgb2 = build_model_xgb(X_data, Y_data)
result_xgb = model_xgb2.predict(X_test)

4.使用LightGBM预测

model_lgb = build_model_lgb(x_train, y_train)
val_lgb = model_lgb.predict(x_val)
AUC_lgb = roc_auc_score(y_val, val_lgb)
print('lightGBM validation AUC', AUC_lgb)

lightGBM validation AUC 0.7327397721650026

model_lgb2 = build_model_lgb(X_data, Y_data)
result_lgb = model_lgb2.predict(X_test)

5.利用ensemble将LightGBM和xgboost模型集成

利用AUC进行加权：

import matplotlib.pyplot as plt
AUC_sum = AUC_xgb + AUC_lgb
predict_y = (1-AUC_lgb/AUC_sum) * result_lgb + (1-AUC_xgb/AUC_sum) * result_xgb
plt.hist(predict_y)
plt.show()

6.输出结果

# 输出结果
sub = pd.DataFrame()
sub['id'] = test_data.id
sub['isDefault'] = predict_y
#sub['price'] = np.exp(predict_y)
sub.to_csv('./result.csv', index = False)