Data Mining
liuke0002
IT屌丝!
展开
-
Datawhale金融风控之贷款违约预测-Task4
逻辑回归模型: 理解逻辑回归模型; 逻辑回归模型的应用; 逻辑回归的优缺点; 树模型: 理解树模型; 树模型的应用; 树模型的优缺点; 集成模型 基于bagging思想的集成模型 随机森林模型 基于boosting思想的集成模型 XGBoost模型 LightGBM模型 CatBoost模型 模型对比与性能评估: 回归模型/树模型/集成模型; 模型评估方法; 模型评价结果; 模型调参:..原创 2020-09-24 23:38:23 · 216 阅读 · 0 评论 -
Datawhale金融风控之贷款违约预测-Task2
数据总体了解: 读取数据集并了解数据集大小,原始特征维度; 通过info熟悉数据类型; 粗略查看数据集中各特征基本统计量; 缺失值和唯一值: 查看数据缺失值情况 查看唯一值特征情况 深入数据-查看数据类型 类别型数据 数值型数据 离散数值型数据 连续数值型数据 数据间相关关系 特征和特征之间关系 特征和目标变量之间关系 ...原创 2020-09-18 22:17:42 · 302 阅读 · 0 评论 -
Datawhale金融风控之贷款违约预测-Task1
1. 赛题概况比赛要求参赛选手根据给定的数据集,建立模型,预测金融风险。赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。2. 数据概况一般而言,对于数据在比赛界面都有对应的数据概况介绍(匿名特征除外原创 2020-09-15 08:16:30 · 191 阅读 · 0 评论