数据竞赛技巧|数据挖掘(四):常用trick介绍

本文为数据挖掘竞赛技巧篇之常用trick介绍。

1.特征选择策略

特征选择(按重要程度排序)对数据分析非常重要。好的特征能够改善模型、提升模型的性能,特征选择主要有两个功能:

  • 减少特征数量、降维,使模型泛化能力更强,减少过拟合;

  • ​增强对特征和特征值之间的理解。 

2.模型融合

一般来说模型融合可以有效的、直接的提升自身模型精度,集成之后的模型比其中任何一个单独的模型都有更高的预测能力。

一般被选手常用的模型融合方式有n折交叉验证法、多模型融合投票法。

3.奥卡姆剃刀原理

奥卡姆剃刀原理应用于模型选择时变为以下想法:在所有可能选择的模型中,能够很好地解释已知数据并且十分简单(特征尽量少,把没有必要的特征干掉、因为碍事还没价值或者价值边际递减的非常厉害)才是最好的,也就是应该选择的模型。

—End—

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值