pyspark 连接远程hive集群配置

LHboboo

已于 2022-06-02 10:39:19 修改

阅读量1.5k

点赞数

分类专栏： python 环境文章标签： hive spark hadoop

于 2022-06-02 10:33:28 首次发布

本文链接：https://blog.csdn.net/u013153465/article/details/125096228

版权

python 环境专栏收录该内容

3 篇文章 0 订阅

订阅专栏

今天本地spark连接远程hive集群，直接把配置导入进去，本地直接应用远程环境

1. 安装spark，设置spark环境变量

2. 拿到远程集群配置文件, 将配置文件放在spark/conf 目录下,

*.xml 一共五个文件

3. 将mysql-connector-java-5.1.32-bin.jar 文件放入spark/jars目录下

4. 然后启动spark-shell 测试

5. 然后在代码里面测试：

import findspark
findspark.init()

import os
from pyspark.sql import SparkSession

os.environ['JAVA_HOME'] = '/opt/java/jdk1.8.0_11'
spark = SparkSession.builder.master("local[*]") \
    .appName("hive") \
    .enableHiveSupport().getOrCreate()
spark.conf.set("spark.sql.execution.arrow.pyspark.enabled", "true")
spark.conf.set('spark.driver.memory', '8g')
spark.conf.set('spark.executor.memory', '4g')
spark.sql("use adm_2153095")
df = spark.sql("show tables")
df.show(10)

好了，配置OK

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LHboboo

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
pyspark 连接远程hive集群配置

今天本地spark连接远程hive集群，参考了网上各种教程，可以使用show 命令，不能使用select，最后直接把配置导入进去，本地直接应用远程环境，竟然可以了步骤：3. 将mysql-connector-java-5.1.32-bin.jar 文件放入spark/jars目录下4. 然后启动spark-shell 测试5. 然后在代码里面测试：好了，快速结束
复制链接

扫一扫