kaggle编码categorical feature总结
kaggle竞赛本质上是套路的竞赛。这篇文章讲讲kaggle竞赛里categorical feature的常用处理套路,主要基于树模型(lightgbm,xgboost, etc.)。重点是target encoding 和 beta target encoding。
总结:
label encoding
特征存在内在顺序 (ordinal feature)
one hot enc...
转载
2019-06-15 23:47:12 ·
498 阅读 ·
0 评论