数据挖掘比赛
Leonardo711
这个作者很懒,什么都没留下…
展开
-
kaggle 代码pipeline学习
#留坑原创 2017-04-23 01:05:32 · 857 阅读 · 1 评论 -
探索性数据分析(EDA)
探索性数据分析(EDA)目的是最大化对数据的直觉,完成这个事情的方法只能是结合统计学的图形以各种形式展现出来。通过EDA可以实现: 1. 得到数据的直观表现 2. 发现潜在的结构 3. 提取重要的变量 4. 处理异常值 5. 检验统计假设 6. 建立初步模型 7. 决定最优因子的设置数据类型数据一般按类型分为两种:离散型和连续型;针对这两种类型的原创 2017-04-20 09:47:23 · 11951 阅读 · 1 评论 -
比赛总结
有一个半月没有写博客了,一来是因为实习的工作量一下变多了,第二是因为在打Tencent的比赛,虽然接触比赛很久,但是这个比赛应该算是我第一个用心从头到尾打的一个比赛。就大致记录一下感悟吧。特征工程首先这一点是任何数据挖掘比赛少不了的,而在这一点上我的能力是非常欠缺的,特征显然是很重要的,但是这次比赛我们欠缺的不单单是这一点,还有更多欠缺的东西需要学习和弥补。问题抽样 这个比赛的复赛阶段数据量很大原创 2017-06-28 14:26:07 · 334 阅读 · 0 评论