![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘比赛
泉水豆花儿
oj8k_chen@163.com
展开
-
【数据挖掘比赛】之 Null Importances(特征选择)
Null Importances在olivier大佬的kernel上看到的https://www.kaggle.com/ogrellier/feature-selection-with-null-importances,思想也很纯粹,最近也用了好多次,效果还不错。主要思想:通过利用跑树模型得到特征的importance来判断特征的稳定性和好坏。1)将构建好的特征和正确的标签扔进树模...原创 2019-11-13 18:09:02 · 4762 阅读 · 0 评论 -
【数据挖掘比赛】之 Adversarial validation
Adversarial validation数据挖掘比赛,一般都分为train(线下)和test(线上),test一般分为A榜和B榜。所以,做模型的时候首先要考虑的是train和test的分布是不是一致,保证分布的一致,是做模型的前提咯。不然,线下好的很,线上也是各种蹦,线上线下不一致。其次,要trust local cv, 线上显示的A榜只是具有一点点的参考性,千万不要一味地被A榜的分数牵着...原创 2019-11-12 09:52:27 · 901 阅读 · 1 评论