SparkSQL 与 Hive 如何整合？关键步骤有哪些？

最新推荐文章于 2024-06-18 09:37:18 发布

Blue92120

最新推荐文章于 2024-06-18 09:37:18 发布

阅读量766

点赞数

文章标签： hive hadoop 大数据

本文链接：https://blog.csdn.net/Blue92120/article/details/130820436

版权

根据原理，就是Spark能够连接上Hive的MetaStore就可以了。所以：

1.MetaStore需要存在并开机

2.Spark知道MetaStore在哪里（IP端口号）

SparkSQL 和 Hive整合关键四步骤

第一步：将hive-site.xml拷贝到spark安装路径conf目录

第二步：将mysql的连接驱动包拷贝到spark的jars目录下

第三步：Hive开启MetaStore服务

第四步：测试SparkSQL整合Hive是否成功

Spark on Hive原理和配置

第一步：将hive-site.xml拷贝到spark安装路径conf目录

node1执行以下命令来拷贝hive-site.xml到所有的spark安装服务器上面去

cd /export/server/hive/conf
cp hive-site.xml /export/server/spark/conf/
scp hive-site.xml root@node2:/export/server/spark/conf/
scp hive-site.xml root@node3:/export/server/spark/conf/

第二步：将mysql的连接驱动包拷贝到spark的jars目录下

node1执行以下命令将连接驱动包拷贝到spark的jars目录下，三台机器都要进行拷贝

cd /export/server/hive/lib
cp mysql-connector-java-5.1.32.jar  /export/server/spark/jars/
scp mysql-connec

最低0.47元/天解锁文章

Blue92120

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SparkSQL 与 Hive 如何整合？关键步骤有哪些？

node1执行以下命令来拷贝hive-site.xml到所有的spark安装服务器上面去。node1执行以下命令将连接驱动包拷贝到spark的jars目录下，三台机器都要进行拷贝。根据原理，就是Spark能够连接上Hive的MetaStore就可以了。第一步：将hive-site.xml拷贝到spark安装路径conf目录。(1)修改 hive/conf/hive-site.xml新增如下配置。第二步：将mysql的连接驱动包拷贝到spark的jars目录下。第三步：Hive开启MetaStore服务。
复制链接

扫一扫