Datawhale
阿德罗斯
记录学习和生活
展开
-
金融风控 task3
文章目录学习目标学习过程读取数据异常值处理特征预处理缺失值填充 学习目标 学习特征预处理、缺失值、异常值处理、特征分桶等特征处理方式 学习特征交互、编码、选择的相应方法 学习过程 读取数据 import pandasaspd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import datetime fromt qdm import tqdm from sklearn.preprocessin原创 2020-09-21 23:59:05 · 2539 阅读 · 0 评论 -
金融风控入门赛 task2
EDA 数据总体了解 读取数据集并了解数据集大小,原始特征维度 读取数据的扩展知识 :对于文件特别大的场景,通过nrows参数,来设置读取文件的前多少行;分块读取 通过info熟悉数据类型 粗略查看数据集中各特征基本统计量 缺失值和唯一值 查看数据缺失值 查看唯一值特征情况 深入数据-查看数据类型 类别型数据 数值型数据 离散数值型数据 连续数值型数据 特征分箱 数值型特征本是可以直接入模的,但往往风控人员要对其做分箱,转化为WOE编码进而做标准评分卡等操作。 从模型效果原创 2020-09-18 22:53:29 · 100 阅读 · 0 评论 -
金融风控-贷款违约预测 task1
文章目录学习目标预测指标ROC 学习目标 理解赛题数据和目标,清楚评分体系。 下载数据和结果提交打卡,熟悉比赛流程 预测指标 竞赛使用 AUC 做评价指标。AUC 被定义为 ROC 曲线下与坐标轴围成的面积。 ROC ROC 使用正例率和负例率做横纵轴 正例率 TPR = TP/(TP+FN); 负例率 FPR = TN/(TN+FP); 如图所使,ROC 一般是在 y=x 之上,所以 AUC 面积在 0.5-1 之间,数值越大效果越好。 ...原创 2020-09-14 22:31:49 · 121 阅读 · 0 评论