- 博客(2)
- 资源 (4)
- 收藏
- 关注
转载 Hive MapJoin 执行计划
本文通过展示hive.mapjoin.smalltable.filesize 这个参数的设置,来比较是否使用mapjoin的执行计划的区别 测试sql: SELECT id, clienttime FROM ( SELECT id, clienttime, key FROM log_table WHERE day = '20180801' ) a1 LEFT JOIN (S...
2018-12-12 14:51:05 1079
转载 机器学习实用指南——集成学习和随机森林
梯度提升 另一个非常著名的提升算法是梯度提升。与 Adaboost 一样,梯度提升也是通过向集成中逐步增加分类器运行的,每一个分类器都修正之前的分类结果。然而,它并不像 Adaboost 那样每一次迭代都更改实例的权重,这个方法是去使用新的分类器去拟合前面分类器预测的残差 。 让我们通过一个使用决策树当做基分类器的简单的回归例子(回归当然也可以使用梯度提升)。这被叫做梯度提升回归树(GB...
2018-12-02 19:27:28 395
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人