- 博客(4)
- 收藏
- 关注
原创 2020-09-27
5 Task5 模型融合Tip:此部分为零基础入门金融风控的 Task5 模型融合部分,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷款违约预测地址:5.1 学习目标将之前建模调参的结果进行模型融合。尝试多种融合方案,提交融合结果并打卡。(模型融合一般用于A榜比赛的尾声和B榜比赛的全程)5.2 内容介绍模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果哦,往往模型相差越大且模型表现都不错的前提下,模型
2020-09-27 23:34:29
58
原创 Task4 建模与调参
4.2 内容介绍逻辑回归模型:a. 理解逻辑回归模型;b. 逻辑回归模型的应用;c. 逻辑回归的优缺点;树模型:a. 理解树模型;b. 树模型的应用;c. 树模型的优缺点;集成模型a. 基于bagging思想的集成模型随机森林模型b. 基于boosting思想的集成模型XGBoost模型LightGBM模型CatBoost模型模型对比与性能评估:a. 回归模型/树模型/集成模型;b. 模型评估方法;c. 模型评价结果;模型调参:a. 贪心调参方法;b. 网格调参
2020-09-24 23:46:01
76
原创 TASK3:Feature Engineering
TASK2:EDA一、导入数据分析及可视化过程需要的库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimeimport warningswarnings.filterwarnings('ignore') 二、读取文件data_train = pd.read_csv('./train.csv') data_test_a = pd.re
2020-09-21 23:18:15
73
1
原创 金融风控-TASK1 赛题理解
金融风控-TASK1 赛题理解一、赛题理解赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。 如何充分利用给出的各类数据,筛选并构建有效特征成为比赛制胜的关键。二、赛题简介赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对empl
2020-09-15 23:12:56
178
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人