目录
信用风险是金融市场中最古老、最重要的风险维度,同时也是巴塞尔新资本协议所提及的商业银行所面临的最主要的风险之一,因此本方案项下“指标标签体系”,拟紧密围绕“客户信用风险评价”展开和搭建。具体的搭建方法将分别从信贷技术和数据验证两个维度出发:
一方面借鉴如“5C信贷分析法”等专家技术经验,从业务含义出发,评价客户还款能力、还款意愿,综合判定客户信用风险高低。
5C分类 | 含义 | 备注 |
品质 (Character) | 努力履行其偿债义务的可能性 | 直接反映意愿 |
能力 (Capacity) | 如流动资产数量、质量,判断依据通常是客户的偿债记录、经营手段等。 | 直接反映能力 |
资本 (Capital) | 如财务实力和财务状况,表明顾客可能偿还债务的背景,如负债比率、流动比率、速动比率、有形资产净值等财务指标等。 | 直接反映经营 |
担保(Collateral) | 主要指第二还款来源。 | 间接反映资产 |
条件(Condition) | 客户困难时期的付款历史,在经济不景气情况下的付款可能。 | 其他压力测试 |
另一方面结合业务中沉淀的数据风控成果,将上述反映客户品质、能力等维度的分析视角,拆分为更加细化的评价维度,形成客户信用风险评价的基本框架,
综上,形成一套支持多类别主体(个人、企业、交叉),多数据维度的客户信用风险评价框架,并基于上述评价维度,提炼可服务于小微融资业务的客户标签,帮助业务与风险人员快速了解评价客体的核心风险点。
1.设计方法
1.1 框架设计
基于上述理念,自下而上形成数据、指标、标签三级结构。
1.2 内容设计
1.2.1 基于业务解读视角的内容设计
业务解读视角下的内容设计,是基于标签评价主体生命周期展开的,具体可而分为个人、企业两类主体。
针对企业而言,企业生命周期按照企业从成立到消失,分为“注册登记→生产经营→注销登记”三个阶段。
针对个人而言,个人生命周期按照个人从诞生到死亡,“分为诞生→生存→死亡”三个阶段。
评价客体在上述阶段中的行为、动作,均会留存相应数据,并关联映射出相关的业务含义。如,企业经营阶段的外部销售端,会在税务系统中沉淀涉税申报数据,并反映出企业的申报行为、申报规模,进而可用于推导其信用风险。本方案中的客户标签,基于客户自身生命周期,从其不同发展阶段中抽象提炼出的“可用于评价其信用风险”的数据结果,其值具备可分类性。
在具体的构建方法上,为了合理、科学构建标签,我们按照“八大要素(参与方、时间、地点、内容、动机、方式、金额、结果。)”对客户发生事件进行拆解,通过这些要素的组合以及分析方法,形成结构化的标签体系,要素的具体含义如下:
要素 | 含义 |
参与方(WHO) | 指事件发生(行为)的参与方。 |
时间(WHEN) | 描述事件发生(行为)的时间。 |
地点(WHERE) | 事件发生(行为)的地点。 |
内容(WHAT) | 描述事件的具体内容,构成要素。 |
方式(HOW) | 事件发生(行为)的方式。 |
动机(WHY) | 事件发生(行为)的原因。 |
金额(HOW MOCH) | 事件涉及到的金额。 |
结果(RESULT) | 事件发生(行为)形成的结论性信息。 |
标签的构建路径,是通过上述要素的组合,分析、抽象形成标签构建方法
1.2.2 基于数理算法视角的内容设计
本方案数理算法视角下的内容设计,是基于数据指标层面的暴力衍生方法展开的,在当前阶段暂不纳入设计范畴,后期可视业务需求和数据接入、沉淀情况继续补充。
1.3 设计运作
1.3.1 基本应用
本项目通过有效运用省联社已建设的线上信贷风控能力,结合“专家经验”+“量化建模”,构建指标标签体系,建立科学动态的分类管理机制,应用于行内线下小微业务数字化能力提升,为行内信用评价提供服务。指标标签体系可服务于客户信用风险评价的业务目标,由底层数据应用支撑包括:线上及线下数据的具体应用,建立微观层面的客户风险评价体系,完善底层微观评价指标池,为指标提供最基础数据能力。标签体系是基于指标的诉求,加以分析手段,形成可以反馈指标问题且合适提高指标的标签内容。自下而上包含数据、指标、标签三个应用层级,层级越靠底部,与业务的耦合度就越小。层级越靠顶部,与业务的耦合度就越大。
- 数据层:底层的源内容,价值在于沉淀和底层信息的查询;
- 指标层:业务加工内容,用于支撑、维护标签体系建设;
- 标签层:业务提炼内容,用于快速评价、掌握客户能力;
1.3.2 方案优化
本方案客户标签体系可支持优化反馈闭环,在具备基础体系的条件下,结合后续业务表现和结果监控,可形成“资产数据化、数据资产化”的良性循环生态,随着行里的数据类型引入越多,业务表现越多,可实现标签体系的不断丰富、完善和优化,进而推动客户风险评价无限趋于精准
2. 标签介绍
2.1 标签属性
标签属性为针对标签进行的再标注,这一环节的工作主要目的是帮助内部理解标签赋值的来源,进而理解指标的含义。标签从运算层级角度可以分为模型标签与基础标签,具体如下:
1)模型标签:从通过不同基础标签的组合,用算法计算出特定风险维度的综合性评价,如:评价经营能力高低,预测信用风险高低等。其价值优势在于:固化的维度评价,具有框架上的稳定性,同时补足使用者的评价能力;
2)基础标签:基于客观事实,通过结果直接形成,或通过规则间接形成的客户信息。具体分为:“事实标签”、“规则标签”:
a.事实标签:即从原始数据中提取,无加工规则,依据实际情况归纳的客观结果;例如用户信息中提取的用户性别、生日、手机号等;
b.规则标签:有加工规则,依据实际情况,叠加业务偏好归纳的提炼性结果简单如:18~35岁,则为”青年“;复杂如:男性+企业中层以上+资产规模500万以上+30为以下=”年轻有为“等 。
2.2 标签类型
1)连续变量(Continuous):是在任意两个值之间具有无限个值的数值变量。例如【个人当前信用卡支用比例】等等。
2)分类变量(Nominal):是离散的,一般又包括名义分类变量和序数分类变量。富有经济含义的一般为序数分类变量,例如:【企业纳税信用评级】,结果为 ABCD 应用中存在A>B>C>D,即为具有经济含义,也可能有少部分名义分类变量,例如:【个人性别】、【个人学历】等。
对于数值型的离散变量,一般要求作为连续变量处理。
2.3 标签展示
1)单值型枚举标签:一个用户标签中只能有一个选项值。例如:【是有存量客户】,只能为“是”或“否”其一,不可同时命中;
2)多值型枚举标签:一个用户标签中可能有多个选项值。例如:【办公区域】,可以为“上海”、和“北京”同时命中。
2.4 参数设计
标签参数的初始设定一般分为以下几类:
1)事实标签参数:直接设置为客观结果,或是根据数值表现,以便于区分为原则,设置对应档位;
2)规则标签参数:当前冷启动阶段主要结合人工经验与行业常识来综合设置;
3)模型标签参数:当前冷启动阶段主要结合人工经验、行业常识与其他项目的量化结果参考来综合设置;
标签参数的优化设定将参考系统投产后的业务表现,逐步调整到位。