自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 贷款违约建模与调参

1. 导入相关库和相关设置import pandas as pdimport numpy as npimport warningsimport osimport seaborn as snsimport matplotlib.pyplot as plt"""sns 相关设置@return:"""# 声明使用 Seaborn 样式sns.set()# 有五种seaborn的绘图风格,它们分别是:darkgrid, whitegrid, dark, white, ticks。默认的主题

2020-09-24 22:11:38 378

原创 金融风控之贷款违约–特征工程FeatureEngineering

金融风控之贷款违约–特征工程1 学习目标(1)学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法;(2)学习特征交互、编码、选择的相应方法;2 主要内容(1)数据预处理   缺失值的填充;   时间格式处理;   对象类型特征转换到数值;(2)异常值处理   基于3sigma原则;   基于箱型图;(3)数据分箱   固定宽度分箱;   分位数分箱;     离散数值型数据分箱;     连续数值型数据分箱;   卡方分箱;(4)特征交互   特征和特征之间组合

2020-09-21 22:24:32 490

原创 零基础入门金融风控-贷款违约预测-数据分析

1.数据分析       查看并初步了解数据,熟悉数据,为后续的特征工程做准备,主要目的如下:       1.EDA价值主要在于熟悉整个数据的基本情况(取值类型、取值类别、取值范围、缺失值、异常值等),对数据集进行分析是否可以进一步进行建模分析;       2.了解各变量间的相互关系、变量与

2020-09-18 22:19:04 1859

原创 零基础入门金融风控-贷款违约预测-赛题理解

零基础入门金融风控-贷款违约预测文章目录前言 一、赛题数据 1.字段表 2.评价指标 二、使用步骤 1.引入库 2.读入数据 总结前言赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postC..

2020-09-15 23:14:57 655

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除