贷款违约预测挑战赛
文章平均质量分 93
小曹小曹喜欢吃草
这个作者很懒,什么都没留下…
展开
-
Baseline
import pandas as pdimport osimport gcimport lightgbm as lgbimport xgboost as xgbfrom catboost import CatBoostRegressorfrom sklearn.linear_model import SGDRegressor,LinearRegression,Ridgefrom sklearn.preprocessing import MinMaxScalerimport mathimpo原创 2020-10-10 23:56:34 · 1205 阅读 · 1 评论 -
Task4 建模与调参
此部分为零基础入门金融风控的 Task4 建模调参部分,带你来了解各种模型以及模型的评价和调参策略4.1学习目标学习在金融风控领域常见的机器学习模型学习机器学习模型的建模任务与调参流程完成相应的学习打卡任务4.2内容介绍逻辑回归模型理解逻辑回归模型;逻辑回归模型的应用;逻辑回归的优缺点;树模型理解树模型;树模型的应用;树模型的优缺点;集成模型基于bagging思想的集成模型随机森林模型基于boosting思想的集成模型XGBoost模型Lig原创 2020-10-06 19:56:29 · 515 阅读 · 0 评论 -
TASK 3:特征工程
3.1学习目标学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法学习特征交互、编码、选择的相应方法完成相应学习打卡任务3.2内容介绍数据预处理缺失值的填充时间格式处理对象类型特征转换到数值异常值处理基于3segama原则基于箱型图数据分箱固定宽度分箱分位数分箱离散数值型数据分箱连续数值型数据分箱卡方分箱(选做作业)特征交互特征和特征之间组合特征和特征之间衍生其他特征衍生的尝试(选做作业)特征编码one-hot编码l原创 2020-10-05 23:08:31 · 330 阅读 · 1 评论 -
补充学习内容(数据挖掘:理论与算法)
清华大学-数据挖掘:理论与算法(国家级精品课)B站地址https://www.bilibili.com/video/BV154411Q7mG?p=38笔记地址https://blog.csdn.net/qq_43724306/article/details/104531299原创 2020-09-27 20:16:43 · 119 阅读 · 0 评论 -
Task5 模型融合
5.1学习目标将之前建模调参的结果进行模型融合。 尝试多种融合方案,提交融合结果。(模型融合一般用于A榜比赛的尾声和B榜比赛的全程)5.2内容介绍模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果哦,往往模型相差越大且模型表现都不错的前提下,模型融合后结果会有大幅提升,以下是模型融合的方式。平均简单平均加权平均投票简单投票法加权投票法综合排序融合log融合stacking构建多层模型blen原创 2020-09-27 01:09:51 · 76 阅读 · 0 评论 -
Task2 数据分析
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimeimport warningswarnings.filterwarnings('ignore')#在python中代码可以正常运行但是会提示警告,我们可以通过警告过滤器进行控制是否发出警告消息。data_train=pd.read_csv('train.csv')data_test_原创 2020-09-19 10:53:21 · 253 阅读 · 0 评论 -
Task01:赛题理解
Task01:赛题理解本次新人赛是Datawhale与天池联合发起的金融风控之贷款违约预测挑战赛。 赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高。1.1 学习目标理解赛题数据和目标,清楚评分体系。完成相应报名,下载数据和结果提交打卡,熟悉比赛流程。1.2 了解赛题1.2.1赛题概况比赛要求参赛选手根据原创 2020-09-19 16:17:04 · 436 阅读 · 0 评论