自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 论XGBOOST科学调参

XGBOOST的威力不用赘述,反正我是离不开它了。具体XGBOOST的原理可以参见之前的文章《比XGBOOST更快--LightGBM介绍》 今天说下如何调参。 bias-variance trade-off xgboost一共有几十个参数:http://xgboost.readthedocs.io/en/latest/parameter.html中文版解释:http

2017-02-18 21:11:51 565

原创 比XGBOOST更快--LightGBM介绍

xgboost的出现,让数据民工们告别了传统的机器学习算法们:RF、GBM、SVM、LASSO........。现在,微软推出了一个新的boosting框架,想要挑战xgboost的江湖地位。笔者尝试了一下,下面请看来自第一线的报告。  包含以下几个部分:一. 基本介绍二.  XGBOOST原理及缺点三. LightGBM的优化四. 建模过程(python)五. 调参 一. 基

2017-02-18 21:11:48 3441 1

原创 数据分析利器之hive优化十大原则

hive之于数据民工,就如同锄头之于农民伯伯。hive用的好,才能从地里(数据库)里挖出更多的数据来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。hive在极大数据或者数据不平衡等情况下,表现往往一般,因此也出现了presto、spark-sql等替代品。今天不谈其它,就来说说关于hive,个人的一点心得。 一. 表连接优化 1.  将大表

2017-02-18 21:11:45 257

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除