要实现好的风控,前提:
要保证数据的质量
数据质量:不仅要看数据源,数据的清洗更为重要。
数据的清洗标准流程:1.数据质量的判断
2.做衍生变量(目前我在做的地方)
3.加工、清理
这几个要求非常严谨
这一块没有做好,在厉害的算法都没有意义!
目前我们信贷:评分、产品优选、额度计算器等都传入 强相关与弱相关变量
组装的变量有 :借贷人基本信息包括配偶、亲属(2人)、非亲属信息(3人),关注检测信息、黑名单(客户、客户经理、渠道)、征信报告信息(强相关变量)、第三方数据防止欺诈(汇法、同盾、宜信致诚)、现场调查数据、电话核查数据、人脸识别(通过身份证上面的照片与现场采集的照片进行比对 相似度60%)等,具体 业务的否决,通过,统一通过 政策服务(Fico)