自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 零基础入门金融风控-贷款违约预测之TASK4_模型融合

针对分类问题,在简单方法中常用到投票法(Voting)。在不改变模型的情况下,直接对各个不同的模型预测结果进行投票,sklearn库中的VotingClassifier是投票法的实现。 投票法的输出有两种类型:一种是直接输出类标签,另外一种是输出类概率。使用前者进行投票为hard voting,使用后者进行分类叫做soft voting,通过voting参数进行控制。 from xgboost import XGBClassifier from sklearn.linear_model import Log

2020-09-27 23:45:45 172

原创 零基础入门金融风控-贷款违约预测之TASK4_模型及调参

1、常用算法 (1)逻辑回归 算法简单,训练速度较快。在线性回归中得到一个预测值,再将该值映射到Sigmoid函数中就完成了由值到概率的转换。 自变量取值为任意实数,值域为[0,1],可将任意的输入映射到了0至1区间。 (2)决策树 从根节点开始一步步走到叶子节点(决策),所有的数据最终都会落到叶子节点。训练过程:首先选择根节点特征(分类的效果最好的特征),接下来应该选择什么特征,考虑如何进行特征切分,最终训练成一棵完整的树。目标即通过一种衡量标准,来计算通过不同特征进行分支选择后的分类情况,找出来最好的那

2020-09-24 23:47:53 270

原创 零基础入门金融风控-贷款违约预测之TASK3_特征工程

1、数据缺失值填充 区分开数值型特征和类别型特征后用平均数填充数值型特征;用众数填充类别型特征。 train[numerical]=train[numerical].fillna(train[numerical].median()) train[category]=train[category].fillna(train[category].mode()) 2、把对象类型特征转换到数值 将原来的文本类别用特定的数值代替。 train["employmentLength"].value_counts(dro

2020-09-21 23:26:04 276

原创 零基础入门金融风控-贷款违约预测之TASK2_探索性数据分析EDA

1、读取文件 train = pd.read_csv('train.csv') testA = pd.read_csv('testA.csv') 2、基本了解 train.head() 这里是引用

2020-09-18 23:10:02 320

原创 零基础入门金融风控-贷款违约预测之TASK1_赛题理解

赛题以预测用户贷款是否违约为任务,根据借款人的数据信息预测其违约概率,提交结果为每个测试样本是1的概率。评价方法为AUC评估模型效果(越大越好)。 赛题链接:https://tianchi.aliyun.com/competition/entrance/531830/information 1、数据概况 数据包含47列变量信息,其中15列为匿名变量,总数据量超过120w,为了保证比赛的公平性,将从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、p

2020-09-15 20:44:09 756

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除