kaggle比赛前要牢记的几个无关具体技术的重要诀窍

1、不要试图一开始就产出一个完美无缺的代码,先撸一个baseline的model出来,再进行后续的分析步骤,一步步提高,所谓后续步骤可能包括『分析model现在的状态(欠/过拟合),分析我们使用的feature的作用大小,进行feature selection,以及我们模型下的bad case和产生的原因』等等。
2、对数据的认知要优先于对模型的选择
3、数据中特殊点、离群点的分析和处理极为重要
4、特征工程(feature engineering)太重要了!在很多Kaggle的场景下,甚至比model本身还要重要
5、一定要做模型融合

参考:
https://blog.csdn.net/han_xiaoyang/article/details/49797143

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值