逻辑回归模型:广泛应用在申请评分、行为评分、市场响应、客户流失等建模领域。
决策树模型:往往被用来做催收评分和客户盈利模型。
神经网络模型:用来防止申请和交易欺诈。
信用评分的主要目的是估计消费者的信用情况(正常或违约),具体做法是根据酷虎的历史信息资料,利用合适的数学统计模型,得到消费者违约的概率值。
客户的信息资料:人口统计学数据(性别、年龄、婚姻、收入、住房、居民、教育、种族、子女)、客户行为信息(交易记录、产品所有和使用记录)、征信机构的数据和评分
信用评分的步骤:
(1)业务理解与目标的量化定义
银行信用卡中心的目标:构建信用卡申请者的评分模型+减少客户违约造成的的损失。
信用评分的目标:预测客户是否违约。某银行对于违约的:客户在持卡期间欠款时间逾期90天,视作违约,被标识为“坏”客户。
(2)数据理解
明确商业目标后,下一步寻找数据,帮助实现商业目标。数据来源:银行内部信息+申请表信息+征信局外部信息
数据筛选:考虑样本的大小和质量。下一步数据质量检测和数据整合。
(3)数据准备
数据准备在整个数据评分的过程中非常重要,消耗时间也非常长,大约80%的时间花费在数据准备上。
目的:准备建模视图(宽表),包含预测建模中所有变量的数据宽表,且每个客户只有唯一的一条记录。
三方面的工作:一是收集到不同的数据集,大量清洗和转换,处理异常值和缺失值。二是粗选预测变量