比赛
一棵树先生
这个作者很懒,什么都没留下…
展开
-
贷款违约建模与调参
1. 导入相关库和相关设置import pandas as pdimport numpy as npimport warningsimport osimport seaborn as snsimport matplotlib.pyplot as plt"""sns 相关设置@return:"""# 声明使用 Seaborn 样式sns.set()# 有五种seaborn的绘图风格,它们分别是:darkgrid, whitegrid, dark, white, ticks。默认的主题原创 2020-09-24 22:11:38 · 367 阅读 · 0 评论 -
金融风控之贷款违约–特征工程FeatureEngineering
金融风控之贷款违约–特征工程1 学习目标(1)学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法;(2)学习特征交互、编码、选择的相应方法;2 主要内容(1)数据预处理 缺失值的填充; 时间格式处理; 对象类型特征转换到数值;(2)异常值处理 基于3sigma原则; 基于箱型图;(3)数据分箱 固定宽度分箱; 分位数分箱; 离散数值型数据分箱; 连续数值型数据分箱; 卡方分箱;(4)特征交互 特征和特征之间组合原创 2020-09-21 22:24:32 · 488 阅读 · 0 评论 -
零基础入门金融风控-贷款违约预测-数据分析
1.数据分析 查看并初步了解数据,熟悉数据,为后续的特征工程做准备,主要目的如下: 1.EDA价值主要在于熟悉整个数据的基本情况(取值类型、取值类别、取值范围、缺失值、异常值等),对数据集进行分析是否可以进一步进行建模分析; 2.了解各变量间的相互关系、变量与原创 2020-09-18 22:19:04 · 1839 阅读 · 0 评论 -
零基础入门金融风控-贷款违约预测-赛题理解
零基础入门金融风控-贷款违约预测文章目录前言 一、赛题数据 1.字段表 2.评价指标 二、使用步骤 1.引入库 2.读入数据 总结前言赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postC..原创 2020-09-15 23:14:57 · 649 阅读 · 0 评论