个人觉得Kaggle是训练data mining特别好的地方,而对于机器学习的提升并不是特别大。你可以去看已经结束的比赛的winner的解决方案,大部分都是ensemble learning,很少有数学上极其优美的解法。
可以从以下几个方面入手:
1. Feature Engineering
- continue variable
- categorical variable
2. Classic machine learning algorithm
- LR, KNN, SVM, Random Forest, GBRT, FM, NN
3. Cross validation, model selection
- grid search, random search, hyper-opt
4. Ensemble learning
推荐这篇 Kaggle Ensembling Guide
5. 多看看之前比赛的winner解决方案
可以从以下几个方面入手:
1. Feature Engineering
- continue variable
- categorical variable
2. Classic machine learning algorithm
- LR, KNN, SVM, Random Forest, GBRT, FM, NN
3. Cross validation, model selection
- grid search, random search, hyper-opt
4. Ensemble learning
推荐这篇 Kaggle Ensembling Guide
5. 多看看之前比赛的winner解决方案
作者:张卫鹏
链接:https://www.zhihu.com/question/23987009/answer/91132803
来源:知乎
著作权归作者所有,转载请联系作者获得授权。