我们在工作中,前前后后接触到了很多的数据源,有些数据源对我们建模有很好的效果,今天抽空回忆回忆过往自己用过的或者是有听说过的一些数据源(部分可能现在由于法律规定没法继续用了),供大家对风控建模常用的数据源有哪些,有一个相对全貌的认识,也欢迎各位同行补充,毕竟以下的很多内容大多数基于本人浅薄的工作经历总结的。😁
我们在上一几期的文章中《风控模型在什么位置发光发亮》有讲到,我们的风控模型一般在风控的不同环节都发挥着不同的作用,比如产品&营销阶段的产品定价、客户推荐,贷前阶段的客户准入、预授信、放款监控,贷中阶段的额度利率管理、逾期预测、客户流失预测,贷后阶段的逾期催收、授信重新计算、失联风险等等。
不同阶段的模型,可以用到的数据源也是不同的,有些是因为获取不到,有些是因为有所侧重。而数据的来源,也主要有3个渠道,一是用户自己提供的,二是公司经客户授权后获取的内部数据,三是从外部第三方接入的数据。我也打算按这3个渠道来罗列一些数据源,并会简单地说一下,具体数据会怎么用。
01 客户自己提供的数据
这类的数据大同小异,一般就是包括客户的基本信息,