专栏:谈谈我对当下大数据整顿的理解与风控建议

FAL金科应用研究院
专栏:谈谈我对当下大数据整顿的理解与风控建议
最近大数据行业爬虫业务监管调查风波刚稍有平息,又有P2P行业疑是被传“全军覆没”,国家年前的整治力度可不谓不大。有一些学员私下来问:数据源都凉凉了,还怎么做风控?我相信这也是所有信贷风控行业从业者共同担心的问题。对于从事金融信贷的机构,数据就好比这台机器永动的“石油”,在现在”石油“限采之余,我们应该怎么应对呢?

罪恶之源是利益至上

还记得美国制裁伊朗这件国际事件吗?有一很大原因是因为伊朗的石油能源丰富,美国为了自己的利益,对不向其妥协的伊朗最终发动制裁。

对于中国互联网行业,尤其是中国金融科技和人工智能的发展速度之所以能够弯道超车欧美,正是得益于丰富大数据的“供养”。大数据业内一直有一个比喻:大数据是“石油”,算法算力是“发动机”。欧美造“发动机”的水平很高,但无奈作为燃料的“石油”不太够,因此只能跑跑停停;而中国虽然算法算力上还有差距,但丰富的大数据资源能够在“发动机”性能落后的情况下,也能够持续跑、跑的远。

为什么美国的“石油”不太够,我们的“石油”源源不断?

不是因为美国不愿意开采,而是因为美国公民对于隐私数据的保护意识已经很到位,而反观中国公民,街边随便扫码领个小礼品就可以开放给商家获取自己微信信息,更别说,又有多少人会在打开一个App后详细看冗长的用户隐私数据保护条例和一个个选择性授权App获得个人手机权限。

可以跟大家分享,以上动作我是都做完的。

部分大数据公司正是发现中国公民对于隐私数据的保护意识不强,并且商业利用价值巨大,才开始过度无节制地挖掘用户隐私信息。如果用户适度分享自己的数据,确实可以获得更便捷、更低成本、体验更好的服务,而互联网公司也会因此不断迭代算法,创新产品,获得更快的发展,而不是因为用户因为缺乏数据隐私保护意识而过度开采,用最暴力的方式实现自己利益最大化。

目前国家监控力度之大,究其根本,是公民隐私数据保护意识之薄弱与部分大数据公司无底线的利益至上。

是否还有可为

很多人担心大数据行业一旦完蛋,金融信贷业务就不用做了。

这个观点我一直不赞同。

过度依赖外界因素的项目,一定做不长久。

前几年数据公司如雨后春笋般涌出,给了很多金融机构发展业务的便利,甚至一些金融机构的风控业者拿来就用,丝毫不做任何数据分析。三方数据公司建议这个多头阈值要大于5,风控就按照5以上进行拒绝,丝毫没有考虑自家公司的用户基群,产品定价,风控战略,更别说这个多头共债变量有没有去重、变量构造的底层逻辑以及多家三方数据公司多头变量的数据口径。

乱控、瞎控,行业水平层次不齐。

业务还在飞速发展下,不良风险还不易发现,不良率总会被不断扩张的新增业务所覆盖,一旦业务趋稳甚至政策监管,隐形不良开始显现。

正好赶在国家监管之余,大家都应该慢下来看看自己的风控策略是否合适,业务客群是否细分,风险定价是否差异化。

我相信,审时度势之余,更多的优化自身风控真实力,才能迎接雨后彩虹。

如何作为

一、评分制+无意义字段输出

对于金融科技大数据公司,适度的挖掘用户信息必不可免。另一方面,原始数据的输出不再是最佳方式。考虑评分制+脱敏衍生数据的输出,可以是短期的应对策略。

而对于金融信贷机构,数据源的调用监测务必更加频繁。

前几天针对数据监管这件事,与一位风控策略朋友私下交流中发现,他家在某个数据源某类数据停止输出的6天后,才发现这个数据源的某类数据在未正式商务通知停止服务的前提下,已经无法调用了长达6天之久。

虽然数据源某个变量无法返回也可能是常态事件,但对于一些核心风控规则数据如要素验证、黑名单等,如果没有设置好调用返回空值的风控处置流程,很有可能会在短短时间内发生信用风险激增,甚至集中欺诈。

对于他们这些多年风控策略经验的老风控,都在一时大意下产生了这样的失误,更别说一些根本没有核心风控的金融机构,会暴露多大的信贷风险。

二、风险规则优先级重排,中度甚至弱度规则应该更具逻辑性

在之前有大量数据源强规则使用的时候,金融机构风控可以通过在风控策略中配置更多的强规则将大部分风险拒之门外,但是现在好用变量越来越少的前提下,对于风险中度相关甚至弱性相关的变量挖掘和逻辑匹配将更重要,也意味着客群细分和风控策略将会更加复杂。

打个比方,客群要从进件之初就划分好定义规则,走更加差异化的审批流程。对于风控规则,如个贷历史最长连续逾期月数(两年)这个强规则,假设设置为>=2进行拒绝后,近24个月个贷累计逾期次数、近24个月申请人和配偶个贷累计逾期期数合计、近60个月个贷最长连续逾期期数、近60个月个贷累计逾期次数等规则的阈值设计要考虑与强规则阈值逻辑一致,避免发生客群细分后的规则冲突。

三、技术的问题仍需用技术来解决

只要市场对数据的需求存在,即使监管再严格,也总会有人因为利益去铤而走险。数据隐私归根到底要从技术上入手,技术带来的新问题最终还是要用技术来解决。

比如,获得图灵奖的MPC(Secure Multi-Party Computation),是一个名为“多方安全计算”的理论框架,基于此架构,可以实现数据使用权、所有权的分离,数据所有方可以保有数据,但是又不影响数据需求方提供服务,简单来说,就是基于加密的数据进行计算。

最近又火热起来的联合建模,我认为也算是MPC方向工业化应用1.0,联邦学习是MPC方向工业化应用2.0,未来基于区块链技术的创新,也会为隐私数据使用带来更多的商业应用保护。

四、风控模式上的适应性调整

之前有一篇分享文有讲到一夜回到解放前,无数可依之下如何做好风险控制,一经发出被很多人留言吐槽,但据我目前所知,一些头部金融机构已经开始重配自动审批与人工审批的权重,甚至一些持牌小贷机构,开始重新布局一些线下信贷业务的比重。

不用盲目推崇自动化,没有过时的风控模型,只有适应时势的风控模式和信贷业务。

金融是高诱惑行业,如何守住底线,适度借助外力,提升自身硬实力,审时度势调整风控战略,才能在大浪淘沙之下永葆活力,枯木逢春。

微信公众号搜索:「 金科应用研院」
可以从菜单栏点击「在线学习」
更多风控资讯与干货学习资料,都在微信公众号

回复关键字: 「风控量化包」➡️领取干货学习资料
回复任意词可以加我们官方微信加入风控学习群
不定期分享干货资料,一起讨论风控经验~

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值