常用数据介绍(二)

不定期更新信贷大数据风控的相关内容(命名为#大数据风控手册#),一是对工作的沉淀和总结,二是为对大数据风控感兴趣的大家提供参考。既然数据是实现大数据风控的基础,今日来看看有哪些常用的数据。

欢迎添加微信“huaiping595468”,一起探讨风控课题。

转载请注明出处。

----------------------------------------------------以下是本文正文-------------------------------------------------------

近几年,外部数据(银行等金融机构的自身以外的数据)的引入和应用几乎成为大数据风控的标配,可以很大程度上补充行内数据以及人行征信数据的不足,比如:在互联网金融的借贷、失信情况、设备安全性等等,可以让我们更加全面的评估和把控风险敞口。

外部数据主要分为几大类:监管数据、政务数据、商业数据、互联网数据四大类。

  • 监管数据

监管数据主要是由银保监、中国人民银行等金融监管机构发布的或内部共享的数据,最常见的有人行征信数据、大额交易数据、百行等征信数据、金融系统黑名单数据等等。

这些数据基本来自是各家银行、消金公司、金融公司等持牌金融机构的上报,在监管机构以报告或名单方式,按一定的频率更新,实现金融机构数据的共享。金融机构之间存在同质性,客群、金融产品都比较相似,所以这类数据可用性、覆盖性、准确性都是最高的,是金融机构做大数据风控依赖的核心数据。

  • 政务数据

随着各行业的数字化热火朝天的开展,对权威、客观数据的需求也越来越强烈,各地政务部门也开始着手打通和完善政务数据,以更好的赋能数字化转型进程。常见的政务数据主要包括:公积金数据、社保数据、税务数据、工商数据、法院数据、公安数据、运营商数据、学历数据、海关、发票、水电、房产、车产等数据。

可以发现,政务数据与我们的生活息息相关,所以都是强金融数据,可以直接反映我们的收入、经营的稳定性和高低水平。是非常准确的判断还款能力的数据。

  • 商业数据

从2013年左右开始商业数据呈井喷式发展,带动了数据产品发展的同时,使得数据的可获取性、可使用性得到了极大的提升,与此同时也带来的数据安全性、保密性等系统性的全面规范,让商业数据从野蛮生长期快速进入合规发展期。

目前明确规定了个人数据的使用需通过个人征信牌照进行获取和使用,不能再通过数据公司获取数据(过渡期到2023年6月30日)。

商业数据的补充,使得在判断借款客户还款能力和还款意愿时,更加充分和完整。这类数据主要包括:同业消费信息、出行数据、电商数据、交通数据、社交数据、关系数据、设备及IP数据、物流数据、网贷数据、招聘数据、采购数据、招投标数据、用车数据、车辆行驶等。

  • 互联网数据

除了上述三大类数据外,还有一类数据,在大数据风控中也有所应用,但随着数据安全和合规要求的趋严,这类数据的使用越来越少,主要是通过爬虫技术爬取到的数据,包括公开数据,如论坛、微博、新闻等舆情信息;强授权后的非公开数据,如支付宝、微信、短信等。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值