- 表格型数据为什么那么神奇,能让树模型在各种真实场景的表格数据中都战胜深度学习呢?作者认为有以下三种可能:
- 神经网络倾向于得到过于平滑的解
- 冗余无信息的特征更容易影响神经网络
- 所以一定程度的特征交叉是不是必要的,因为one-hot特征过于稀疏,如果有可能,直接输入一部分交叉特征。
- 表格型数据并不是旋转不变的
参考资料:
为什么基于树的模型在表格数据上仍然优于深度学习:https://blog.csdn.net/deephub/article/details/126580032
同上:https://fesian.blog.csdn.net/article/details/126798583?spm=1001.2101.3001.6650.2&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ERate-2-126798583-blog-126580032.pc_relevant_3mothn_strategy_and_data_recovery&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ERate-2-126798583-blog-126580032.pc_relevant_3mothn_strategy_and_data_recovery&utm_relevant_index=3