搭建金融信贷中的机器学习模型
文章平均质量分 95
评分卡,预处理与特征构建,模型的监控与调优等
夜景黑色调
这个作者很懒,什么都没留下…
展开
-
模型评价指标(混淆矩阵,AUC,ROC)
模型的预测性:正例覆盖率:表示正确预测的正例数在实际正例数中的比例,即Sensitivity,也叫Recall=TPTP+FNRecall=\frac{TP}{TP+FN}Recall=TP+FNTP,所有真正违约的样本中,能被模型检测出来的比例。负例覆盖率:表示正确预测的负例数在实际负例数中的比例,Specificity=TNTN+FPSpecificity=\frac{TN}{TN+FP}Specificity=TN+FPTNAUC曲线:x轴为1-specificity,即负例错判率;y轴原创 2021-10-30 07:44:40 · 782 阅读 · 0 评论 -
申请评分卡
一、数据的预处理与特征构建简介:在构建评分卡模型的工作中,数据预处理工作和特征构建工作是至关重要的一步。数据的预处理工作可以有效处理缺失值与异常值,从而增强模型的稳健性。而特征构建工作则可以将信息从字段中加以提炼,形成有业务含义的优异特征。1.评分卡简介:风控场景中的评分卡:1)以分数的形式来衡量风险几率的一种手段;2)是对未来一段时间内违约/逾期/失联概率的预测;3)有一个明确的(正)区间;4)通常分数越高越安全;5)数据驱动;6)反欺诈评分卡、申请评分卡、行为评分卡、催收评分卡。申请评分卡(Ap原创 2021-05-08 17:46:03 · 1496 阅读 · 0 评论 -
第四章 数据的预处理与特征构建(续)
申请评分卡模型数据的预处理与特征构建(续)课程简介:逻辑回归模型的特征需要是数值型,因此类别型变量不能直接放入模型中去,需要对其进行编码。此外,为了获取评分模型的稳定性,建模时需要对数值型特征做分箱的处理。最终在带入模型之前,我们还需要对特征做单变量与多变量分析的工作。目录: 特征的分箱WOE与特征信息值单变量分析与多变量分析特征的分箱...原创 2020-05-26 14:50:00 · 795 阅读 · 0 评论 -
第九章 组合模型在信贷风控中的应用
组合模型在信贷风控中的应用简介:在包括违约预测在内的诸多场景中,越来越多的建模人员将模型集成的方式应用在实际工作中,并且取得了不错的成效。本节课将介绍三种基本的集成方式:Bagging,boosting,stacking。目录:1.元模型与集成模型2.多模型的bagging3.多模型的boosting4.多模型的stacking1.元模型与集成模型什么是集成模型:把多种单...原创 2020-05-31 09:18:00 · 208 阅读 · 0 评论 -
第六章 模型的验证、监控与调优
模型的验证、监控与调优简介:得到评分卡模型后,还需要验证模型的性能。并且部署后还要持续监测模型的表现。目录:模型的区分度模型的预测性与混淆矩阵模型的平稳性模型的调优模型的区分度区分度的概念评分模型的作用是通过分数将好坏人群进行区分。从分数的性质可以看出,好的评分模型下违约人群的分数低、非违约人群的分数高。反之坏的评分模型下违约与非违约人群的分数是几乎无法区分的。在理想模...原创 2020-05-27 16:40:00 · 687 阅读 · 0 评论 -
第五章 逻辑回归模型在评分卡开发中的应用
逻辑回归模型在评分卡开发中的应用课程简介:在分类场景中,逻辑回归模型是常用的一类算法。它具有结构简单、可解释性强、输出结果是"软分类"的特点。评分模型多采用这类算法。同时逻辑回归模型也面临一些限制,因此在特征工程阶段我们对输入特征做了相应的调整和约束。目录:逻辑回归模型的基本概念基于逻辑回归模型的评分卡构建工作尺度化1. 逻辑回归模型的基本概念伯努利概型在分类模型中,目标...原创 2020-05-26 16:13:00 · 562 阅读 · 1 评论