Windows ，PySpark 访问远程 Hive 环境搭建

最新推荐文章于 2024-02-27 11:42:46 发布

灰灰鲁伊

最新推荐文章于 2024-02-27 11:42:46 发布

阅读量1.6k

点赞数 1

分类专栏：大数据文章标签： spark hive python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36988978/article/details/106557521

版权

大数据专栏收录该内容

18 篇文章 17 订阅 ¥9.90 ¥99.00

订阅专栏

本文详细介绍了在Windows环境下，如何配置Java、Hadoop、Spark环境，安装Pyspark，并进行必要的配置文件调整，以实现通过Python接口PySpark访问远程Hive服务。同时，文中也提到了编写代码时需要注意的事项。

摘要由CSDN通过智能技术生成

Java环境配置

安装`JDK`,配置环境变量 `JAVA_HOME`,因为 Hadoop 需要依赖 Java 环境

Hadoop环境配置

可以去Apache Hadoop 官网下载需要的 Hadoop 版本,[Apache.Hadoop下载地址][1]
解压,配置 HADOOP_HOME/bin
cmd > hadoop version  验证是否安装成功

Spark环境配置

去Apache.Spark官网下载对应 Hadoop 版本的 Spark,[Spark下载地址][2]
配置 SPARK_HOME
cmd > spark-shell  稍等片刻会出现 Spark 的图形文字,进入到 Spark-Shell 输入界面,说明 Spark安装成功

Pyspark 安装

博主用的是 Windows+pyspark环境,在 PyCharm 的 terminal 终端输入 pip3 install pyspark 即可
新建工程,到这一步已经可以使用pyspark 执行 sparksql了
博主需要的用到 pyspark 去连接远程 hive服务,用 sparksql 跑 hive 的数据
这个时候写好代码直接去跑会报一个错误关于 winutils.exe 的,缺少这个文件,去网上下载一个对应 hadoo

了解本专栏

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

灰灰鲁伊 CSDN认证博客专家 CSDN认证企业博客

码龄8年

50: 原创

10万+: 周排名

6万+: 总排名

3万+: 访问

: 等级

777: 积分

37: 粉丝

19: 获赞

6: 评论

35: 收藏

私信

关注

热门文章

分类专栏

最新评论

Windows ，PySpark 访问远程 Hive 环境搭建
yeqianglin2020: 上述的配置可以让你使用sparksql了，但是仍然无法连接到远程hive,和hdfs，需要几个配置文件拷贝hdfs-site.xml,hive-site.xml,core-site.xml 文件到你的spark安装目录的conf 目录下，最好yarn-site.xml 和 mapred-site.xml 一起拷过去,免得以后又出什么幺蛾子拷完之后,运行代码就可以成功,因为配置文件里面包含了集群的地址等信息这步是将远程spark集群的hdfs-site.xml,hive-site.xml,core-site.xml 文件拷贝到本地win 10电脑上的spark目录下吗？
采坑笔记-GeoIP 库的坑
灰灰鲁伊: 我摸索出来的东西我不能免费
采坑笔记-GeoIP 库的坑
企鹅大大帝: 免费吧，都是面向百度编程。
百度地图显示用户网络头像并调整用户头像大小
杨亮Jerry: 你好，你这样添加网络图片后地图拖拽不会卡顿吗？
学习笔记-Android AIDL传递对象数据
taowuhua: 实体类的包名和aidl的包名需要保持一致，这里真是坑。我栽在这里一下午

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

灰灰鲁伊 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。