DataWhale_17
等等党
一名工程专业的直博三年级学生,想通过自己的努力成为一名ds分析师。
展开
-
DataWhale 金融风控-贷款违约预测 Task3 特征分析
Task3 特征分析import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimefrom tqdm import tqdmfrom sklearn.preprocessing import LabelEncoderfrom sklearn.feature_selection import SelectKBestfrom sklearn.feat原创 2020-09-21 23:28:12 · 203 阅读 · 0 评论 -
DataWhale 金融风控-贷款违约预测 Task2 数据分析
Task2 数据分析import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimeimport warningswarnings.filterwarnings('ignore')# 2.1 读取文件data_train = pd.read_csv(r'...\train.csv')data_test_a = pd.read_csv(r'...原创 2020-09-18 23:41:34 · 262 阅读 · 0 评论 -
DataWhale 金融风控-贷款违约预测 Task1赛题理解
Task1 赛题理解赛题以金融风控中的个人信贷为背景,要求根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款。1.1 赛题概况根据给定的数据集,建立模型,预测金融风险。该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。其中,80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时employmentTitle、purpose、postCode和title等信息已脱敏。1.2 数据概况(字段信息)FieldD原创 2020-09-15 20:51:14 · 457 阅读 · 0 评论