Spark-SQL连接Hive的五种方法

本文详细介绍了Spark-SQL连接Hive的五种方法:内嵌Hive、外部Hive、通过Spark beeline、Spark SQL CLI以及代码操作Hive。每种方法都包含具体的操作步骤,如配置文件的拷贝、驱动添加等,适用于不同场景下的连接需求。
摘要由CSDN通过智能技术生成

Spark-SQL连接Hive 的五种方法

一、内嵌的 HIVE

如果使用 Spark 内嵌的 Hive, 则什么都不用做, 直接使用即可。但是在实际生产活动当中,几乎没有人去使用内嵌Hive这一模式。

二、外部的 HIVE

如果想在spark-shell中连接外部已经部署好的 Hive,需要通过以下几个步骤:
1、Spark 要接管 Hive 需要把 hive-site.xml 拷贝到 conf/目录下
2、 把 Mysql 的驱动 copy 到 jars/目录下(在hive的lib目录下可以找到)
3、 如果访问不到 hdfs,则需要把 core-site.xml 和 hdfs-site.xml 拷贝到 conf/目录下
4 、重启 spark-shell
在这里插入图片描述

三、运行 Spark beeline

Spark Thrift Server 是 Spark 社区基于 HiveServer2 实现的一个 Thrift 服务。旨在无缝兼容HiveServer2。因为 Spark Thrift Server 的接口和协议都和 HiveServer2 完全一致,因此我们部署好 Spark Thrift Server 后,可以直接使用 hive 的 beeline 访问 Spark Thrift Server 执行相关语句。Spark Thrift Server 的目的也只是取代 HiveServer2,因此它依旧可以和 Hive Metastore进行交互,获取到 hive 的元数据。
如果想连接 Thrift Server,需要通过以下几个步骤:
1、 Spark 要接管 Hive 需要把 hive-site.xml 拷贝到 conf/目录下
2、 把 Mysql 的驱动 copy 到 jars/目录下
3、如果访问不到 hdfs,则需要把 core-site.xml 和 hdfs-site.xml 拷贝到 conf/目录下
4、启动 Thrift Server

sbin/start-thriftserver.sh

在这里插入图片描述
5、使用 beeline 连接 Thrift Server

beeline -u jdbc:hive2://node01:
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值