- 博客(4)
- 收藏
- 关注
原创 贷款违约建模与调参
1. 导入相关库和相关设置import pandas as pdimport numpy as npimport warningsimport osimport seaborn as snsimport matplotlib.pyplot as plt"""sns 相关设置@return:"""# 声明使用 Seaborn 样式sns.set()# 有五种seaborn的绘图风格,它们分别是:darkgrid, whitegrid, dark, white, ticks。默认的主题
2020-09-24 22:11:38 378
原创 金融风控之贷款违约–特征工程FeatureEngineering
金融风控之贷款违约–特征工程1 学习目标(1)学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法;(2)学习特征交互、编码、选择的相应方法;2 主要内容(1)数据预处理 缺失值的填充; 时间格式处理; 对象类型特征转换到数值;(2)异常值处理 基于3sigma原则; 基于箱型图;(3)数据分箱 固定宽度分箱; 分位数分箱; 离散数值型数据分箱; 连续数值型数据分箱; 卡方分箱;(4)特征交互 特征和特征之间组合
2020-09-21 22:24:32 490
原创 零基础入门金融风控-贷款违约预测-数据分析
1.数据分析 查看并初步了解数据,熟悉数据,为后续的特征工程做准备,主要目的如下: 1.EDA价值主要在于熟悉整个数据的基本情况(取值类型、取值类别、取值范围、缺失值、异常值等),对数据集进行分析是否可以进一步进行建模分析; 2.了解各变量间的相互关系、变量与
2020-09-18 22:19:04 1859
原创 零基础入门金融风控-贷款违约预测-赛题理解
零基础入门金融风控-贷款违约预测文章目录前言 一、赛题数据 1.字段表 2.评价指标 二、使用步骤 1.引入库 2.读入数据 总结前言赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postC..
2020-09-15 23:14:57 655
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人