hive on spark安装

最新推荐文章于 2023-06-03 20:55:52 发布

李孟聊人工智能

最新推荐文章于 2023-06-03 20:55:52 发布

阅读量1.7k

点赞数

分类专栏： Spark实战文章标签： hive spark

本文为博主（李孟）原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/qq_19968255/article/details/71023759

版权

Spark实战专栏收录该内容

25 篇文章 8 订阅 ¥99.90 ¥99.00

订阅专栏

超级会员免费看

承接安装系列环境

背景：Hive默认使用MapReduce作为执行引擎，即Hive on mr。实际上，Hive还可以使用Tez和Spark作为其执行引擎，分别为Hive on Tez和Hive on Spark。由于MapReduce中间计算均需要写入磁盘，而Spark是放在内存中，所以总体来讲Spark比MapReduce快很多。因此，Hive on Spark也会比Hive on mr快。为了对比Hive on Spark和Hive on mr的速度，需要在已经安装了Hadoop集群的机器上安装Spark集群（Spark集群是建立在Hadoop集群之上的，也就是需要先装Hadoop集群，再装Spark集群，因为Spark用了Hadoop的HDFS、YARN等），然后把Hive的执行引擎设置为Spark。

Spark运行模式分为三种1、Spark on YARN 2、Standalone Mode 3、Spark on Mesos。

Hive on Spark默认支持Spark on YARN模式，因此我们选择Spark on YARN模式。Spark on YARN就是使用YARN作为Spark的资源管理器。分为Cluster和Client两种模式。

环境说明(要么所有安装包基于cdh,要么都不基于)

操作系统：CentOS 7

Hadoop 2.6.0(按照原先文档安装)

Zookeeper3.4.5(按照原先文档安装)

Hbase1.1.4(按照原先文档安装)

Hive2.0(按照原先文档安装)

Spark1.5.0

MySQL 5.1(按照原先文档安装)

JDK

了解本专栏

超级会员免费看

李孟聊人工智能

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
hive on spark安装

承接安装系列环境背景：Hive默认使用MapReduce作为执行引擎，即Hive on mr。实际上，Hive还可以使用Tez和Spark作为其执行引擎，分别为Hive on Tez和Hive on Spark。由于MapReduce中间计算均需要写入磁盘，而Spark是放在内存中，所以总体来讲Spark比MapReduce快很多。因此，Hive on Spark也会比Hive on m...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

李孟聊人工智能 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。