关于数据驱动消费金融业务的几点看法

本文将从数据驱动、风险收益平衡、换入换出、实验、指标几个角度来谈一谈我对数据渠道消费金融业务的一些看法。
数据驱动
随着移动互联网深入到人类生活的方方面面,大数据和机器学习技术不断发展,各种简单易用的工具(creditmodel?)也层出不穷,使得数据分析和机器学习的门槛也越来越低,这些技术在互联网和消费金融行业迅速普及,现在各家银行和消费金融机构,或外包或自建团队,砸重金到数据平台、决策引擎、模型和算法等新奇玩意上,我觉得并非是这些机构要引领行业变革,而是一种由于深怕自己在数字化改革浪潮中滞后或被同行耻笑的焦虑导致——有哪家银行或机构敢说自己的消费金融业务没有大数据风控模型?

大数据、机器学习、深度学习,这些名词和概念听起来很有科技感和未来感,但这些技术仅仅只是丰富了我们的信息维度,强化了我们收集和处理数据的能力,这些都是“术”的迭代,“道”,即金融的本质和基本规律并没有改变。

一些消费金融从业人员,沉迷于大量的统计技术和花样繁多的模型,长期被从样本(可能是有偏的)抽离出的表象所“蒙骗”,忽视了业务的基础和本质,从而做出错误的业务决策,造成重大损失。我们应该利用信息技术的优势,高效地从错综复杂的信息中,提炼出问题的根本原因,我们必须有充足的知识和经验提出正确的问题,从而做出正确的决策。我们要透过表象看到本质,从风险、成本、收益等基础角度去思考消费金融每个环节的基本规律。

说了这么多,所谓数据驱动消费金融业务到底是什么呢?其实就是数据科学和科学方法论在金融业务里面的一个实际运用。经济学、生物、化学、物理等基础学科也是在应用这一套方法论。物理学大牛费曼对这套科学方法论做了一个深刻的总结:
首先你要猜测,这是最重要的一步。然后计算结果。将结果与经验(实验)进行比较。如果与经验(实验)不符,这种猜测就是错误的。这句简单的话就是科学的关键。不管你猜得有多漂亮也不管你有多聪明,或者你叫什么名字。如果它与经验不符,那它就是错误的。就是这样。——理查德·费曼(Richard P. Feynman)
社会学家华莱士对科学研究方法做了更加深入的总结,提出了著名的“科学环”,如下图所示:

在这里插入图片描述

具体来说,就是我们会在业务实践中总结出一系列的假设出来,我们会根据这些假设对业务做一些判断和预测,据此做出一些业务决策。我们的业务决策是不是正确的,是不是能够拓展,这在假设的基础上并不是很清楚的,必须通过实践:要么验证这些假设,要么推翻这些假设,我们在验证假设过程中,又会根据现实提出一些新的假设,在这个基础上我们不断循环、反复,不断的提高我们的业务水平,这就是所谓数据驱动的方法。
它并不是说你建套模型,然后根据这个模型,你就可以把这个模型运用到各个业务的方方面面。实际上数据驱动是这么一套方法论,这套方法论让我们对我们所开展的业务的每个环节都有正确的认识,然后在正确的认识的基础上指导我们把业务做得更好。
风险与收益平衡
很多传统金融银行的风险管理人员通过贷前、贷中、贷后一系列复杂的流程,希望尽可能杜绝坏账,他们认为没有坏账就没有风险。你要办理一张信用卡,可能会去你单位进行调查,看你的社保公积金,看你的银行流水,然后再决定是否发卡给你。这一套流程已经将很多人拒之门外,而实际上没有一家银行的坏账为0,他们在尽力避免坏账的同时,也损失了利润。在这里,我要吐槽一下,很久之前,我在宇宙行申请了人生第一张信用卡,只有1万额度,8年了,还是1万额度。
消费信贷的目标不应只是减低坏账,而应该是在利润最大化的前提下尽力避免损失或坏账风险,利润最大化是比减少损失更合理的业务目标,要坚持风险和收益平衡的原则。

基于客户生命周期的P&L分析(Profit & Loss analysis)分析,它是整个数据驱动的一个核心的工具。它告诉我们,在不同的情况之下,我们的盈利损失的表现是什么,我们的决策最终会怎么样影响利润和损失。(后面,我会详细介绍这个P&L 分析工具,请大家关注汉森定理公众号。)
换入换出
前一篇文章已经介绍了换出换出分析:

熟练掌握风控策略的换入换出(Swap Out & Swap In)分析

mp.weixin.qq.com
图标
,有兴趣的同学可以参考。

换入换出分析本来叫做:swap set analysis。换入换出在做一件什么事情呢?简单来说,如你有A、B、C、D四类人,你当前的准入策略,通过A、B客群,拒绝C、D客群,当你迭代了策略之后,变成了通过B、C客群,拒绝A、D客群。这个时候C就是换入客群( swap out set ),A就是换出客群(swap out set),这个时候你需要知道A和C的实际表现是什么样子,对于A你有历史数据,可以估算,对于C你可能没有历史表现数据,无法准确估算。将来新的策略运用到实际业务当中去的时候,你要对A和C做好监控。因为你通过历史样本的分析,知道客群是什么样子,过去的表现是什么样子,从而证明采用新策略是不是正确,对于业务有什么影响,但是你不知道将来在你实施新策略之后,这样的事情还会不会发生。如果不做换入换出分析的话,你不知道会得到什么样的结果。
你的策略过去拒绝掉的客户,现在要通过他,这是一个非常重要的决策。换入换出分析所做的事情,就是让你知道这一决策会对业务产生什么样的影响。不做换入换出分析,模型迭代之后,直接就上线决策了,结果最后发现实际结果和预测很不一致,这种情况在国内非常常见。我觉得从从业务的角度来说,这是一项不管采取什么样的策略,上线新产品也好,开放新客群也好,都一定要做的非常重要的事情。
实验
实验是我们开展业务过程中检验假设、因果推断和获得正确结论,支持正确决策的重要的工具和方法。

如果你建了一个分数在0-1之间的信用评分模型,你根据模型的坏账分布,增加了一条策略,即信用评分模型在0.4以上的人全部拒绝。这意味着,在策略实际上线后,不会有模型分大于0.4的人。下一次建模或者策略迭代的时候,你只能从0-0.4之间通过的客户做样本,这是一个非常糟糕的事情,这样一来,你的客群会越做越窄。

从另外一个角度来看,大于0.4的客户,并非没有好客户。模型评分大于0.4的人,如果坏账率是30%,还有70%的人是好客户,这这70%的人不是说不是说我们就永远不要他们了,而是通过现在我们掌握的数据和信息、模型和工具、策略和手段,不能把这70%的好人与这30%的坏客户区分开来,我们只好把他们拒绝了,但是将来如果我们有新的数据、新的模型和新的策略,很有可能把这70%的人当中一些好客户给找出来。如果你不做实验,不预留样本,在你下一次的模型和策略迭代时,就没有办法把就70%的好好人给挑出来,所以一定要想办法保留一个样本,这会让你将来在做新的模型或策略的时候,能够有合适的样本,支撑你的模型和策略迭代。
业务指标
设计、开发并使用可以准确报告当前业务实际现状和预测业务发展趋势的业务管理指标体系是管控消费信贷业务的关键。为什么这么说呢?首先业务管理指标会告诉我们决策系统是否有效,其次,能够让迅速获取关键信息对业务的发展趋势进行预测,并对问题进行迅速定位。最后,我们掌握信息后,可以迅速决策且采取行动。大家可以参考一下这篇文章:

全面了解消费金融业务指标体系—(一)资产质量分析
全面了解消费金融业务指标体系—(二)模型监控

后记
credtimodel 是汉森老师开发的一个R语言数据科学工具包,有数据预处理、变量衍生、数据分析、数据可视化、自动化建模五大功能模块,已经发布接近两年时间。
在这里插入图片描述
汉森定理( hansenmode )公众号是我的个人公众号,会定期分享风控策略、数据分析、风控建模的相关知识,欢迎关注。有问题需要交流的,可以在关注本公众后之后,加我的个人微信,拉你入群。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值