- 博客(3)
- 收藏
- 关注
原创 论XGBOOST科学调参
XGBOOST的威力不用赘述,反正我是离不开它了。具体XGBOOST的原理可以参见之前的文章《比XGBOOST更快--LightGBM介绍》 今天说下如何调参。 bias-variance trade-off xgboost一共有几十个参数:http://xgboost.readthedocs.io/en/latest/parameter.html中文版解释:http
2017-02-18 21:11:51 565
原创 比XGBOOST更快--LightGBM介绍
xgboost的出现,让数据民工们告别了传统的机器学习算法们:RF、GBM、SVM、LASSO........。现在,微软推出了一个新的boosting框架,想要挑战xgboost的江湖地位。笔者尝试了一下,下面请看来自第一线的报告。 包含以下几个部分:一. 基本介绍二. XGBOOST原理及缺点三. LightGBM的优化四. 建模过程(python)五. 调参 一. 基
2017-02-18 21:11:48 3441 1
原创 数据分析利器之hive优化十大原则
hive之于数据民工,就如同锄头之于农民伯伯。hive用的好,才能从地里(数据库)里挖出更多的数据来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。hive在极大数据或者数据不平衡等情况下,表现往往一般,因此也出现了presto、spark-sql等替代品。今天不谈其它,就来说说关于hive,个人的一点心得。 一. 表连接优化 1. 将大表
2017-02-18 21:11:45 257
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人