目的:判断test和train分布是否相同,由此判断交叉验证是否能满足要求。
方法:train和test数据和在一起,train标记为0.test标记为1。
训练一个分类器,如果该分类器可以很好的将test和train分开,说明train和test分布差异较大。
如果分类器不能很好的将train和test分开(auc=0.5),说明train和test分布相似,不易分开。
Ad validation:https://blog.csdn.net/weixin_43896398/article/details/84762922