ks检验训练集和测试集的分布差异性

另外ks在kaggle上被用于训练集和测试集的分布差异性的量化比较,如果分布差异非常大,很显然这样的特征会导致特征偏移的问题,如果这个特征恰好又特别重要,将大大降低模型的泛化能力,然而在实际应用中,我发现我们在做交叉验证的时候也会发生这种情况,比如用80%的训练集数据作为新训练集,20%的数据作为开发集,也会发生特征迁移的问题,这个时候我们其实也可以事先用ks来检验,我称之为特征分布不稳定问题,比如:
ks具体解释和应用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值