安装pyspark步骤过程

最新推荐文章于 2024-06-30 07:15:00 发布

ljx_63

最新推荐文章于 2024-06-30 07:15:00 发布

阅读量3.1k

点赞数 2

文章标签： spark python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dx63dx/article/details/131116577

版权

一，首先检查java环境的安装

二，打开pycharm，点击左上角File选中Settings，找到图片显示的位置，根据划线的绝对路径，打开自己电脑上的对应位置，然后cmd进入终端，进行下载。

三，PySpark库的安装

输入如下中的其中一个（我一般用第二个下载，比较快）

pip install pyspark==3.3.1

或者

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspark==3.3.1

下载完提示要update的话，直接复制提示给的命令，直接下载

四，配置本机Spark环境

1，将hadoop-3.3.1放到一个指定的目录，比如D:\spark\hadoop-3.3.1

2. 将hadoop.dll放到C:\Windows\System32目录下

3. 配置hadoop环境变量：将hadoop的安装路径，如：D:\spark\hadoop-3.3.1，放到path变量中

4. 将winutils.exe放到hadoop的bin目录下

五，Spark环境准备

使用Spark前必须完成两个操作：

设置Spark的配置信息

创建Spark工具对象

代码示例

# 导包

from pyspark import SparkConf, SparkContext

import os

os.environ['JAVA_HOME']="C:/java/jdk18" #jdk的安装路径

os.environ['SPARK_LOCAL_IP']='127.0.0.1' # 设置当前主机

os.environ["PYSPARK_PYTHON"] = "D:/python/python.exe" # 指定spark运行时，使用的Python解释器（必

须指定，否则执行数据分析时，会报错）

# 1. 创建Spark入口对象

# Spark配置信息的设置：主机和设置Spark工具的名字

conf = SparkConf().setMaster("local[*]").setAppName("spark_test")

# 创建Spark入口对象，即SparkContext对象

sc = SparkContext(conf=conf)

# 2. 使用Spark工具执行操作--- 获取Spark的版本

print(sc.version)

#3. 停止Spark程序

sc.stop()

注意！！！导包那三个路径需要修改（下图划线处）

成功如下

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
安装pyspark步骤过程

下载完提示要update的话，直接复制提示给的命令，直接下载。输入如下中的其中一个（我一般用第二个下载，比较快）导包那三个路径需要修改（下图划线处）须指定，否则执行数据分析时，会报错）四，配置本机Spark环境。将hadoop-3.3.1。配置信息的设置：主机和设置。放到一个指定的目录，比如。五，Spark环境准备。设置Spark的配置信息。创建Spark工具对象。
复制链接

扫一扫

ljx_63 CSDN认证博客专家 CSDN认证企业博客

码龄5年

16: 原创

73万+: 周排名

7万+: 总排名

8256: 访问

: 等级

259: 积分

76: 粉丝

98: 获赞

4: 评论

51: 收藏

私信

关注

热门文章

最新评论

微信小程序模拟器启动失败-usingComponents报错
CSDN-Ada助手: 恭喜你写了第7篇博客！看到你遇到的问题，我想建议你在下一篇博客中可以分享一些解决问题的方法或者技巧，可能会对其他读者也有所帮助。希望你能继续坚持创作，期待你的下一篇博客！
adb常用命令&测试
CSDN-Ada助手: 非常感谢您分享关于adb常用命令的博客！您的文章内容详实，对我们这些初学者来说非常有帮助。希望您能继续分享更多关于技术方面的内容，比如深入解析某些命令的原理或者实际应用场景，这样能让我们更好地理解和运用。期待您的下一篇文章！
python appium自动化_Python+Appium自动化环境搭建
CSDN-Ada助手: 恭喜你写了第6篇博客！看到你分享关于Python+Appium自动化环境搭建的经验，我感到非常兴奋。希望你能继续保持创作的热情，分享更多关于自动化测试的经验和技巧。也许你可以考虑写一些实际案例或者深入探讨一些技术细节，这样能够让读者更加深入地了解自动化测试的应用和实践。期待你的下一篇博客！
appium:App自动化测试环境搭建
CSDN-Ada助手: 恭喜你写了第四篇博客！看到你分享关于appium自动化测试环境搭建的经验，真的让人受益匪浅。希望你能继续保持创作的热情，不断分享自己在技术领域的见解和经验。下一步，也许可以考虑深入探讨appium的一些高级功能或者与其他自动化测试工具的比较，这样可以让读者有更多的选择和思考。期待你更多的精彩内容，加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
SQL查询语句的使用
CSDN-Ada助手: 恭喜您的第三篇博客，主题非常实用！SQL查询语句的使用对于数据处理和管理非常重要，您的分享无疑会帮助到很多需要学习SQL的读者。接下来，我建议您可以结合实际案例，深入探讨一些高级的SQL查询技巧，这样可以进一步丰富您的博客内容，也能让读者受益更多。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。