在Linux的Spark中集成Hive，以及在Pycharm中集成Hive（附案例）

最新推荐文章于 2024-04-25 21:43:48 发布

奇迹虎虎

最新推荐文章于 2024-04-25 21:43:48 发布

阅读量1.5k

点赞数 1

分类专栏： # Spark 文章标签： hive spark linux big data 大数据

本文链接：https://blog.csdn.net/qq_17685725/article/details/123109428

版权

为什么要集成Hive？因为在Linux中的Spark安装包，默认是不能直接读取hive的表的，需要集成hive才能读取hive的库和表；在Linux的Spark中集成Hive；在Pycharm中集成Hive。

摘要由CSDN通过智能技术生成

1、在Linux的Spark中集成Hive

1.1 为什么要集成Hive？

因为在Linux中的Spark安装包，默认是不能直接读取hive的表的，需要集成hive才能读取hive的库和表。

1.2 怎么做？

1、先配置hive环境变量，打开 vim /etc/profile，然后添加两行代码：
```
export HIVE_HOME=/export/server/hive
export PATH=$HIVE_HOME/bin:$PATH
```

2、然后启动hive的metastore

nohup hive --service metastore  2>&1 > /tmp/hive-metastore.log &

3、将metastore的进程端口号告诉给Spark，在spark/conf/的hive-site.xml文件中（可以从hive/conf/hive-site.xml文件拷贝过来即可），里面需包括以下的内容：

    <!-- 默认数仓的路径 -->
    <!-- spark保存数据的路径的配置名叫spark.sql.warehouse.dir
     如果SparkSQL找到了hive.metastore.warehouse.dir，那么
     就用hive.metastore.warehouse.dir的值作为
     spark.sql.warehouse.dir
     如果找不到hive.metastore.wareho

最低0.47元/天解锁文章

奇迹虎虎

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
在Linux的Spark中集成Hive，以及在Pycharm中集成Hive（附案例）

为什么要集成Hive？因为在Linux中的Spark安装包，默认是不能直接读取hive的表的，需要集成hive才能读取hive的库和表；在Linux的Spark中集成Hive；在Pycharm中集成Hive。
复制链接

扫一扫