- 博客(3)
- 收藏
- 关注
原创 天池- IJCAI-18 阿里妈妈搜索广告转化预测新手入门经历(三:lightgbm调参、ensemble)
lightgbm参数解释boosting = ‘gbdt‘,迭代器选’rf’效果略优is_unbalance=True,实际数据的样本是不均衡的,但是设置该参数导致迭代效果变差 bagging_fraction=0.7, bagging_freq =1,使用了bagging方法,随机选择了70%的数据进行训练,每1步迭代做一次bagging效果无明显提高,但是理应有所提高。...
2018-04-22 17:57:52 7237 2
原创 天池- IJCAI-18 阿里妈妈搜索广告转化预测新手入门经历(一:数据预处理、特征工程)
第一次正式参加数据挖掘类的比赛,投入了三个星期。结果没有进入复赛,但是学到了许多经验。感谢技术圈和github的大佬们提供的baseline,让我少走了很多弯路。第一次写博客,其一为了防止以后忘记,其二如果萌新能帮到萌新新们也是很开心啦。思路:全文按照数据预处理、特征工程和模型融合讲解,并附有代码。数据预处理1 导入库和读取数据1.1导入库:import pandas a...
2018-04-22 14:06:59 4275 10
原创 时间序列分析-python(一、自相关系数的意义)
最近在学习时间序列预测销量,做一些笔记。参考:自相关系数根据自相关图判断AR/MA/ARMA模型平稳时间序列时间序列必须是平稳的才可以做后续分析,差分和log都是为了使时间序列平稳。一个时间序列,如果均值和方差没有系统变化或周期性变化(均值无变化:没有明显趋势,方差无变化:波动比较稳定),就称之为平稳的。自相关系数平稳序列的自相关系数会快速收敛,从哪一阶开始快速收敛(忽然从一个较大的值降到0附近)...
2018-04-30 13:36:04 71547 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人