hive
网络空间发展与战略研究中心
这个作者很懒,什么都没留下…
展开
-
Hive SQL的优化
本章只是从HQL层面介绍一下,日常开发HQL中需要注意的一些优化点,不涉及Hadoop层面的参数、配置等优化。 1 使用分区剪裁、列剪裁 在SELECT中,只拿需要的列,如果有,尽量使用分区过滤,少用SELECT *。 在分区剪裁中,当使用外关联时,如果将副表的过滤条件写在Where后面,那么就会先全表关联,之后再过滤,比如: SELECT a.id FROM lxw1234_a转载 2016-12-29 15:09:17 · 5854 阅读 · 1 评论 -
CDH5.9.0集群部署与搭建
原文:http://blog.csdn.net/yizheyouye/article/details/53173912 目录(?)[-] 下载CDH各种RPM包 1 下载cloudera-manager-installerbin2 下载对应平台架构的RPMS 设置IP地址所有节点 1 设置IP地址和网关2 设置主机名 设置hosts文件所有节点关闭防火墙转载 2018-01-08 16:31:08 · 399 阅读 · 0 评论