Spark-SQL连接Hive 的五种方法

最新推荐文章于 2024-05-07 19:24:58 发布

中發白白白

最新推荐文章于 2024-05-07 19:24:58 发布

阅读量3.6k

点赞数

文章标签： hive spark sql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73734232/article/details/128273959

版权

目录

1.内嵌的hive

2.外部的hive

3.运行Spark-SQL CLI

4.运行Spark beeline

5.代码操作hive

1.内嵌的hive

如果使用内嵌的hive，啥也不用做，解压之后进入spark-home目录。

执行bin/spark-sql或者bin/spark-shell，进入交互式命令行之后，使用SQL进行查询：spark.sql("show tables").show。

然后尝试创建表，插入数据。在退出客户端，进入spark-home的目录下，你就会发现生成了derby.log,spark-warehouse目录,以及metadata_db目录,这就是内部hive的目录结构。

此时进入spark-warehouse目录，你就会发现自己刚才创建的表以及表中数据。

2.外部的hive

如果使用外部的hive，需要做以下几步：

1.将hive/conf/hive-site.xml 拷贝到spark的conf目录下。
2.将Hive元数据库MySQL的驱动jar包拷贝到spark的jars目录下。
3.如果访问不到HDFS，将hdfs-site.xml，以及core-site.xml拷贝到spark的conf目录下。
4.启动spark-sql，然后执行select * from tablename。

3.运行Spark-SQL CLI

如果使用运行spark-sql cli连接方法，操作步骤如下：
1.将mysql的驱动放入jars/中。
2.将hive-site.xml文件放入conf/中。
3.运行bin/目录下的spark-sql.cmd 或者打开cmd在D：\spark\spark-0.0-bin-hadoop3.2\bin当中直接运行spark-sql。

最低0.47元/天解锁文章

中發白白白

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
Spark-SQL连接Hive 的五种方法

Spark-SQL连接Hive 的五种方法
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。