Hive on Spark 环境搭建

Hive引擎介绍:

        Hive引擎介绍包括:默认MR、tez、spark。

问题:企业里面用什么呢?

选择取决于,你对性能的要求与数据量本身。

一般都希望运行的快一点,生产环境里面更偏向选择spark,tez是完全基于内存的,数据量之后稳定性不够,日常指标(数据量不是很大),日报表(运行过去一天的数据)考虑用spark,数据量很大,运行很长时间,spark运行时间太长,内存扛不住,稳定性不够,某些指标的执行引擎切换为mr

tez 平时学习,测试的时候使用。我们当前项目用是spark。spark和hive整合。

Hive on Spark:Hive既作为存储元数据又负责SQL的解析优化,语法是HQL语法,执行引擎变成了Spark,Spark负责采用RDD执行。

Spark on Hive : Hive只作为存储元数据,Spark负责SQL解析优化,语法是Spark SQL语法,Spark负责采用RDD执行。

Hive on Spark配置

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值