ks检验训练集和测试集的分布差异性

最新推荐文章于 2023-12-27 10:57:39 发布

weixin_45271076

最新推荐文章于 2023-12-27 10:57:39 发布

阅读量1.3k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45271076/article/details/112632582

版权

另外ks在kaggle上被用于训练集和测试集的分布差异性的量化比较，如果分布差异非常大，很显然这样的特征会导致特征偏移的问题，如果这个特征恰好又特别重要，将大大降低模型的泛化能力，然而在实际应用中，我发现我们在做交叉验证的时候也会发生这种情况，比如用80%的训练集数据作为新训练集，20%的数据作为开发集，也会发生特征迁移的问题，这个时候我们其实也可以事先用ks来检验，我称之为特征分布不稳定问题，比如：
ks具体解释和应用

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。