由于训练样本一般情况下是越多越好,但是生产中的样本量积累较慢,所以考虑用时间跨度比较大的样本进行训练,一方面可以提升模型的泛化性,另一方面还可以提升oot样本的评估指标。
因为采用了时间跨度比较大的样本,很难保证特征稳定性,可以考虑对样本进行时间加权,在筛选特征的时候PSI的筛选阈值放宽泛一些,防止IV值比较高的特征被踢掉。
由于训练样本一般情况下是越多越好,但是生产中的样本量积累较慢,所以考虑用时间跨度比较大的样本进行训练,一方面可以提升模型的泛化性,另一方面还可以提升oot样本的评估指标。
因为采用了时间跨度比较大的样本,很难保证特征稳定性,可以考虑对样本进行时间加权,在筛选特征的时候PSI的筛选阈值放宽泛一些,防止IV值比较高的特征被踢掉。