建立信用评分模型及行为评分模型时需要一个以前的客户样本。在选择样本时候往往面临两个矛盾目标:第一,样本应该对未来可能的信用申请人有代表性,第二,样本应该包括足够的不同类型的还款行为(也就是好客户和坏客户)以使得我们能够确定在未来的客户总体中哪些特征变量可以反映这些行为。
为了区分好的还款行为和坏的还款行为,我们需要样本中的客户有一定时间跨度的还款历史。在行为行为模型中,尤为重要,我们需要一定白嫌弃来确定交易特征变量,也是需要一定的表现期来确定一个客户是好客户还是坏客户。这时候一个这种方案就是,对申请评分模型确定好坏客户为12个月的表现期。行为评分中,通常选取一个18-24个月的时间段,将这一时间段分为两个部分,前9-12个月的表现期用于确定交易变量,另外9-12个月的表现期随着信用产品的不同会发生一些变化。例如大额抵押类产品,周期通常比较长。
下一个问题就是建立评分模型时样本容量应该是多少,其中应有多少好客户,坏客户。样本中好坏客户的数量应该是一样多还是应该反映总体中好、坏客户的发生比?由于采用后一比例失往往导致样本中好客户居多而坏客户的数量不足,引而不能确定坏客户的特征,因此在建模时倾向于号坏客户的比例或者为50:50
这里需要重视的一个问题是,如果我们对坏客户采用一个非常极端的定义,这可能导致实际的坏客户很少,从而使得模型的稳定性收到损害。
从实际层面看,好坏客户的定义并不仅仅是一个理论上的问题,与利润或损失相关的事项都应当考虑进去。我们希望对好客户的定义有一致性,而不希望利用一个因素去协助对高度变化的账户进行分开,一般而言,虽然对好坏客户给出一套可靠合理的定义是很重要的,但是对于建立在这些定义基础上的评分卡有效性的影响并不是很大。
备注:部分内容来源于网络,侵删