![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
天池
joyceying小洲
个人博客请访问www.xiaozhou3l.com
展开
-
task3-特征工程
导入需要用的函数库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimefrom tqdm import tqdmfrom sklearn.preprocessing import LabelEncoderfrom sklearn.feature_selection import SelectKBestfrom sklearn.featu原创 2020-09-21 22:28:54 · 138 阅读 · 0 评论 -
金融风控贷款违约预测探索性数据分析(EDA)【上】
此步骤是为了初步了解数据,熟悉数据为特征工程做准备,不仅要要统计量来显示数据,将数据可视化更利于观察各个类型变量之间的关系1. 数据概览了解导入数据分析及可视化过程需要的库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimeimport warningswarnings.filterwarnings('ignore')train.原创 2020-09-19 09:42:33 · 501 阅读 · 0 评论 -
【天池-Datawhale】零基础入门金融风控-贷款违约预测&赛题理解
赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能(赛事目标),以此判断是否通过此项贷款,这是一个典型的分类问题。一、理解数据该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B字段表FieldDescriptionid为贷款清单分配的唯一信用证标识loanAmnt贷款金额term贷.原创 2020-09-15 22:14:17 · 453 阅读 · 0 评论