信用评估模型
1. 背景和待解决问题:
对于一个前来借钱的新人,希望通过他跟现有用户的关联数据,对于他是好人还是坏人做一个预测。
2. 问题分析和算法选择:
对于来平台借款的新人,所知信息较少,但平台的存量用户已经有了逾期或者欺诈的表现,可以将新申请用户与存量用户做关联分析,近朱者赤近墨者黑,那些与逾期用户关系“密切”的人,很有可能借款后也会变成逾期用户。
那么如何来定义新申请用户和存量逾期用户的关系是否密切呢?可以通过构建用户的社交网络来计算其图特征,社交网络分析SNA是一种识别用户在金融场景反欺诈的有效算法,通过识别用户的一度、二度关系是否逾期或欺诈,以及用户所属团体是否有逾期/欺诈,来定义新申请用户的信用水平;就算不直接将逾期用户关系密切的新用户拒绝,也可以产生很多标签用于进一步挖掘新用户的信用水平。
3. 可用数据和特征:
1)每个人到现在为止是否一直正常还款(好人),还是历史上有逾期过(坏人):最好是有具体的逾期天数或者逾期的严重程度这些;
2)联系人之间的关系:
维度 对应特征
v1 同电脑登陆过 IP地址
v2 相互填为联系人 填写联系人手机号码
v3 同单位 公司名称
v4 相互有电话联系 通讯手机号码
除此之外,还可以考虑获取如下特征用于SNA关联的点:申请人证件号码、绑定银行卡号、MID、IMEI等 ;
4. 算法简介和应用思路ÿ