![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
风控模型
文章平均质量分 87
mishidemudong
菜鸟上路,一颗红心,两手准备。
展开
-
###好好好好##知识图谱在金融风控领域的应用现状
2020年是个人触碰知识图谱时间最多的一年,技术知识的重新梳理和学习,相关项目的参与,几乎从年初持续到年末。一直想总结知识图谱在金融领域的应用现状,但总是挣不脱一个字:乱。最直观的“乱象”是不同机构对这项技术的称呼五花八门——关联网络、关系图谱、复杂网络、知识图谱。严格来讲它们彼此之间紧密相连又有所区别,本文并不打算严谨地去论证它们的区别和联系,请允许我偷懒采用图谱这个名称来泛指这项技术,就是各位所想的——节点-关系网络。图谱之乱远不止此。 金融风控技术演进路线是规则-模型-图谱,对应的技术分别是数转载 2021-10-12 14:48:09 · 616 阅读 · 0 评论 -
信用评分卡模型-数据缺失值处理
image.png一、认识缺失值在我们的数据分析过程中,经常会碰到缺失值的情况。缺失值产生的原因很多,比如人工输入失误,系统出错,或者是正常情况,比如未婚状态下的子女个数肯定是0或者直接不填,这种情况就是正常的。所以我们处理缺失值的步骤一般是:1) 识别缺失值2) 检查导致缺失值的原因3) 删除包含缺失值的行或列或者用合理的数值填补缺失值或者不处理R使用 NA (不可...转载 2019-10-14 00:09:29 · 2558 阅读 · 0 评论 -
#######好好好好好#########笔记︱信用风险模型(申请评分、行为评分)与数据准备(违约期限、WOE转化)
巴塞尔协议定义了金融风险类型:市场风险、作业风险、信用风险。信用风险ABC模型有进件申请评分、行为评分、催收评分。————————————————————————————————————一、数据准备1、排除一些特定的建模客户用于建模的客户或者申请者必须是日常审批过程中接触到的,需要排除以下两类人:异常行为:销户、按条例拒绝、特殊账户;特殊账户:出国、卡丢失/失窃、死亡、未成年、员工账户、VIP;其...转载 2018-02-27 11:06:45 · 634 阅读 · 0 评论 -
想要了解大数据信用风险评分,这篇文章值得细读!(上)
信用风险评分模型是银行等信贷发放机构应用较为成熟的风险计量工具。早在20世纪40年代,美国有些银行就开始尝试性研究信用评分方法,用于快速处理大量信贷申请。1956年,工程师BillFair和数学家EarlIsaac共同发明了著名的FICO评分方法。该方法基本以Logistic回归方法为技术核心,是当前业界应用最成熟的信用风险评分模型。在20世纪60~80年代,随着信息技术的进步和业务的快速发展,信...转载 2018-02-27 18:09:29 · 5362 阅读 · 0 评论 -
信用评分模型11111111
逻辑回归模型:广泛应用在申请评分、行为评分、市场响应、客户流失等建模领域。决策树模型:往往被用来做催收评分和客户盈利模型。神经网络模型:用来防止申请和交易欺诈。信用评分的主要目的是估计消费者的信用情况(正常或违约),具体做法是根据酷虎的历史信息资料,利用合适的数学统计模型,得到消费者违约的概率值。客户的信息资料:人口统计学数据(性别、年龄、婚姻、收入、住房、居民、教育、种族、子女)、客户行为信息(...转载 2018-02-27 18:12:15 · 496 阅读 · 0 评论 -
笔记︱风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)
本笔记源于CDA-DSC课程,由常国珍老师主讲。该训练营第一期为风控主题,培训内容十分紧凑,非常好,推荐:CDA数据科学家训练营——————————————————————————————————————————一、风控建模流程以及分类模型建设1、建模流程该图源自课程讲义。主要将建模过程分为了五类。数据准备、变量粗筛、变量清洗、变量细筛、建模与实施。2、分类模型种类与区别风控与其他领域一样,分类模...转载 2018-03-08 20:20:08 · 949 阅读 · 0 评论 -
ks值和auc值的关系
要弄明白ks值和auc值的关系首先要弄懂roc曲线和ks曲线是怎么画出来的。其实从某个角度上来讲ROC曲线和KS曲线是一回事,只是横纵坐标的取法不同而已。拿逻辑回归举例,模型训练完成之后每个样本都会得到一个类概率值(注意是类似的类),把样本按这个类概率值排序后分成10等份,每一份单独计算它的真正率和假正率,然后计算累计概率值,用真正率和假正率的累计做为坐标画出来的就是ROC曲线,用...转载 2018-03-01 15:14:43 · 20490 阅读 · 3 评论 -
######好好好#####评分模型的检验方法和标准&信用评分及实现
评分模型的检验方法和标准通常有:K-S指标、交换曲线、AR值、Gini数等。例如,K-S指标是用来衡量验证结果是否优于期望值,具体标准为:如果K-S大于40%,模型具有较好的预测功能,发展的模型具有成功的应用价值。K-S值越大,表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。评分模型的检验方法和标准通常有:K-S指标、交换曲线、AR值、Gini数等。例如,K-S指标是用来衡量验证结果是...转载 2018-02-24 16:34:36 · 1431 阅读 · 0 评论 -
大数据新算法在个人信用风险评估模型中使用效果的评估
上世纪80年代,美国费埃哲公司基于逻辑回归算法构建了费埃哲信用评分体系,并成为美国信用评分市场的巨头。然而,随着大数据建模技术的日新月异,许多新算法、新技术层出不穷。本项目选取了五种大数据新算法,包括支持向量机(SVM)、决策树、随机森林、自适应提升(AdaBoost)和梯度提升决策树(GBDT),在中国人民银行征信中心的大规模样本上进行了个人风险评估模型的构建,并从三方面进行评估。首先,从模型的...转载 2018-04-18 13:23:07 · 23970 阅读 · 7 评论 -
风控模型评估方法以及大数据风控模型概念
更新一下有效性指标中的区分能力指标: KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估,指标衡量的是好坏样本累计分部之间的差值。好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。KS的计算步骤如下:1. 计算每个评分区间的好坏账户数。2. 计算每个评分区间的累计好账户数占总好账户数比率(good%)和累计坏账户数占总坏账户数比率(bad%转载 2017-12-12 16:07:39 · 27511 阅读 · 0 评论 -
风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)
本笔记源于CDA-DSC课程,由常国珍老师主讲。该训练营第一期为风控主题,培训内容十分紧凑,非常好,推荐:CDA数据科学家训练营——————————————————————————————————————————一、风控建模流程以及分类模型建设1、建模流程该图源自课程讲义。主要将转载 2017-11-07 20:09:30 · 777 阅读 · 0 评论 -
##好好好####知识图谱的应用#######
导读知识图谱 (Knowledge Graph) 是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。比如在国内,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业 - 互联网金融, 知识图谱可以转载 2017-09-29 13:17:48 · 4915 阅读 · 0 评论 -
智融集团:以人工智能风控技术,淬炼金融圈“最强大脑”
一单价值十个亿的买卖,和十单各自价值一个亿的买卖,创业者会如何选择?或许一些创业者认为,前者都是最优选:省力又省事,还不耽误赚钱。而智融集团CEO焦可却不这么想。“相比每个月放了多少钱,我们更在意每个月放了多少笔款项。”焦可说,“对我们而言,样本量比短期商业获益来得重要。”这一观点,体现了智融集团的商业模式核心要义——通过人工智能打造金融界的“最强大脑”。智融集团专注于研发以人工智能为核心转载 2017-08-16 11:50:37 · 1649 阅读 · 0 评论 -
ROC、AUC、K-S
#标题中的几个指标常用来衡量一个风控模型的优劣。信贷场景下,某模型将一批客户分为了两类,一类是好客户,一类是坏客户,比如用logistic回归预测客户违约率,概率大于0.5的认为是坏客户,小于等于0.5的认为是好客户,那么如何评判该模型对客户的分类准确性呢?我们都期望模型能达到这样一个目的:误杀率最低,漏网率最低,同时通过率最高,即误杀的好客户的数量最少并且正确识别出全部的坏客户,转载 2017-08-11 14:03:08 · 3370 阅读 · 0 评论 -
4步教你开发风控评分模型
“你的模型准么?”“你的模型真的有用么?”“你的模型对风控有价值么?”在为P2P公司建立风控评分模型过程中,这是最常见的问题。为了回答这一问题,我们想先讨论下如何从实际业务出发,以怎样的开发流程才能建立一个有效、有用、有价值的模型,希望读后能给你一定的启发。在互联网金融风控体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。在互联网金融评分卡开发过转载 2017-08-11 15:10:46 · 7242 阅读 · 0 评论 -
##########(好好好)基于深度机器学习算法DBNs的风险识别模型
前言:最初关注深度机器学习是听了NUS的汪晟博士关于深度机器学习平台SIGNA的介绍,当时就发现深度机器学习是人工智能的一个革新的进步。但是由于从事的云计算和大数据方向的工作,所以平时只是作为自己的兴趣领域看了一些相关的入门级资料。最近事业部的同事在讨论文物保护的风险识别问题,不自觉地想到能否将深度机器学习运用到文物保护的风险识别中,于是做了一些较深入的研究,设计了一个基于深度机器学习DBN算法的转载 2017-08-15 11:58:04 · 935 阅读 · 0 评论 -
大数据风控用了什么模型?有效性如何?
目前贷款的风控因为每一个样本的收集都需要放款来收集,想想每人放一万,一个亿也就只能放1万人,所以样本量不会太大。所以所谓大数据风控主要是大在特征的数据上。很多时候是用了很多传统上不怎么敢用的特征。比如传统风控比较害怕missing value 比较害怕不稳定的特征 这些都是大数据风控需要解决的。说到模型,既然是特征多,样本少,那就需要一个非常抗过拟合的模型。另外如果是单独针对反欺诈而不是信用,转载 2017-08-22 11:42:22 · 5324 阅读 · 0 评论 -
AI改变金融风控,深度学习技术可以将坏账降低35% | 干货
昨天在风控群内,大家都在讨论平安普惠COO的观点,“在放贷领域,只有0和1的概念,要么借要么不借”,有人说,0和1的概念肯定不适用于贷款审批,信贷审批是多维评判的,没有不能贷的客户,只有不能贷的机制;也有人说,风险定价、风险补偿机制就是用来在0和1之间进行调节的;而大家都认为,这个话题不能一概而论,要根据客户的还款意愿和还款能力去综合考虑。那么,像信用卡一样,只有0和1概念的企业是不是在风转载 2017-08-15 14:40:28 · 4049 阅读 · 0 评论 -
异常检测算法--Isolation Forest
南大周志华老师在2010年提出一个异常检测算法Isolation Forest,在工业界很实用,算法效果好,时间效率高,能有效处理高维数据和海量数据,这里对这个算法进行简要总结。iTree 提到森林,自然少不了树,毕竟森林都是由树构成的,看Isolation Forest(简称iForest)前,我们先来看看Isolation Tree(简称iTree)是怎么构成的,iTree是转载 2017-08-29 14:38:13 · 1421 阅读 · 0 评论 -
第十一讲.异常检测
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。内容大多来自Standford公开课machine learning中转载 2017-08-29 14:44:11 · 6646 阅读 · 0 评论 -
基于海量弱特征的AI风控模型正渐渐到来
在AlphaGo击败世界围棋冠军、职业九段选手李世石后,人工智能的发展与应用再一次成为人们的视线焦点,同时也引发了人们对人工智能的无限想象。最早提出这一概念的约翰·麦卡锡认为,人工智能就是要让机器的行为看起来像人所表现出的智能行为一样。尽管目前对人工智能的定义并未完全统一,但都体现出人工智能效率高、稳定性高、安全性高等特点。在很多领域中,我们已经发现机器有可能超越人类。人工转载 2017-08-16 11:42:54 · 1382 阅读 · 0 评论