风控每日一问:如何利用互联网金融数据与深度挖掘?

观点:

  • 其实现在做互联网金融风控的,只要稍靠谱的,数据源都差不多。
  • 比如公司的【内部数据源】包括——在自有平台的用户借贷记录,用户申请时的行为数据,还有内部或行业间共享的黑名单、灰名单等。
  • 【外部数据源】有比较常见的八家个人征信机构(雪梨酱注:2015年1月,央行开始允许芝麻信用等8家机构开展个人征信业务)还有就是互联网那金融平台有时会对接一些用户银行卡的字段数据,在用户授权的前提下,会把这个卡的信息和银联的相关数据去比对。但是这位总监觉得,大数据风控的核心点在于:对数据的理解有多深。做大数据风控的人对数据要极其敏感,因此他们会花很多时间在变量上。

    他向我举过两个例子。

  • 第一个是和电商合作做变量的例子:他们可以通过这些合作看到用户订票的信息、机票的信息,比如公务舱、经济舱这些信息——这本身其实也能说明一个人的基本经济情况。

    但是他们会做得更细,会继续做一些叠加或衍生。比如他们会不看公务舱和经济舱的区分,而看飞行每公里的消费单价。因为公务舱和经济舱的价格也会波动很大,有的时候经济舱也有特价票、公务舱也会有优惠活动,所以他们会看每公里的消费金额。

  • 第二个例子是流水话单。他们可以基于同一份电话单,做出很多不一样的变量。比如说用户是否跟某某类的店打过电话?打电话的频次怎么样?趋势怎么样?

    如果用户经常跟贷款中介打电话,或者银行催收中心打电话,那用户应该相对比较缺钱,或者是曾经有过违约的历史。

    相反,如果用户经常给花店打电话买花,说明用户可能是个“好人”;如果经常给婴儿店打电话,说明他可能有孩子,有孩子的话一般比较稳定、也靠谱一些。

    他们会花非常多的时间去衍生这些变量,因为它更直接地反映了这个人的消费行为。当然,也有些时候,这些可能是无用功,有时甚至90%做出来的变量都没有用,但试错筛选出哪怕只有不到10%的可用变量,最终风控效果才是最重要的。

  • 所以,总监觉得,做风控模型这事儿,一方面是个比较“蓝领”的事儿,因为工作需要做得非常细致。但另一方面,是做模型有时也比较“艺术”,因为这是一个比见仁见智的事情。

个人观感:

  • 了解内部数据源和外部数据源的构成
  • 掌握了解对数据的认知是风控的重中之重
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值