信贷风险
文章平均质量分 79
今晚打佬虎
中国厨艺训练学院第105届辍学生,同时还是一名二手的人工智能表演艺术家!
展开
-
信贷违约风险预测(四)训练模型
之前给予application_train.csv和application_test.csv,做了简单的特征工程:得到了下面几个文件:(对recode后的数据做了三种不同的特征处理)Polynomial Features :poly_train_data.csv,poly_test_data.csvDomain Knowledge Features: domain_train_data.c...原创 2018-07-24 08:42:37 · 5328 阅读 · 1 评论 -
数据清洗+特征构造:application_{train|test}.csv
主表:application_trian/test.csvimport numpy as npimport pandas as pdimport warningswarnings.filterwarnings('ignore')%matplotlib inlineimport matplotlib.pyplot as pltPreprocessing application_tr...原创 2018-07-24 18:49:25 · 3342 阅读 · 3 评论 -
信贷违约风险预测(一)样本数据
在现实生活中有些人由于没有或者较少的信用记录,很难获得贷款,为了增加对与没有银行帐号或信用记录人群的借贷的包容性,Home Credit(信贷机构)会利用各种替代数据:电信或交易信息等等客户的历史的行为数据来预测客户还款能力.基于这些数据,利用各种机器学习方法来做出这些预测,确保有能力还款的客户不会被拒绝.数据来自Home Credit数据介绍application_train.c...原创 2018-07-19 19:14:23 · 16706 阅读 · 5 评论 -
信贷违约风险预测(二)简单的数据探索
之前已经简单介绍了数据,客户的违约风险的预测是一个监督学习的任务,主要是对客户进行分类,就是哪些人可以获得贷款,哪些不可以,每个申请者可能会违约的概率在0~1之间,0:表示申请者能及时还款,1:申请者很难按时还款会违约.数据初步探索数据来自Home Credit 共有8个不同数据:application_train.csvapplication_test.csvbureau...原创 2018-07-20 19:46:57 · 12432 阅读 · 9 评论 -
数据清洗+特征构造:bureau.csv
bureau.csv 客户信用报告(信用历史)import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlineimport seaborn as snsimport warningswarnings.filterwarnings('ignore')bur...原创 2018-07-26 17:59:57 · 2313 阅读 · 3 评论 -
Training_model(2)
已经清洗处理了两个数据文件:application_{train|test}.csv :客户详细信息bureau.csv : 客户历史信用报告下面对这两个数据中的特征进行合并,然后Light Gradient Boosting Machine训练模型,之前只用客户数据的预测评分结果是0.734,这次加入了客户信用报告信息import numpy as npimport pand...原创 2018-07-26 22:59:23 · 2707 阅读 · 0 评论 -
信贷违约风险预测(三)简单的特征工程
在数据探索和特征工程阶段,仅仅使用了主表的数据: 主要包含一些客户的详细信息.application_train.csvapplication_test.csv 在数据探索阶段,对数据进行过一些重编码和对齐之后,新数据的特征列有之前的121,增加至241,包含TARGET.Feature Engineering Andrew Ng老师曾说过:”applied machine...原创 2018-07-22 10:25:51 · 6656 阅读 · 2 评论 -
TrainingModel(3)
这次训练数据来自下面文件:application_train.csvapplication_test.csvbureau.csvPOS_CASH_balance.csv1_2_train.csv,聚合了(application_train.csv, bureau.csv)1_2_test.csv,聚合了(application_test.csv, bureau.csv)imp...原创 2018-07-27 21:54:19 · 1413 阅读 · 5 评论