- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 hive优化
学习笔记: hive优化 1.join查询操作的基本原则:应该将条目少的表/子查询放在join操作符的左边,原因是在join操作的Reduce阶段,位于join操作符左边的表内容会被加载进内存,将条目少的表放在左边,可以减少发生内存溢出错误的几率。 2、group by 优化 数据倾斜聚合优化,设置参数hive.groupby.skewindata = true,当选项设定为 true,生
2016-11-28 12:54:23 347
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人