pycharm连接spark

逆境才能成长

已于 2023-03-29 16:57:35 修改

阅读量3.6k

点赞数 7

文章标签： python 大数据 pycharm

于 2023-03-28 23:01:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_71010295/article/details/129826010

版权

1.解压Hadoop，解压到任意盘，路径不要带中文路径

进入保存后的bin目录，查看，是否解压成功

2.解压spark，到任意位置，路径不要带有中文

3. 打开pycharm，把Hadoop，spark环境变量配置到pycharm中。

3.1新建项目

3.2在项目中创建一个python文件

3.3把Hadoop_home，python_home,pythonpath添加到Pycharm中.

1.HADOOP_HOME

2.SPARK_HOME

3.PYTHONPATH

4.注意！！！

PYTHONPATH路径要添加到D:\spark\spark-2.4.6-bin-hadoop2.7\python\lib\py4j-0.10.7-src.zip下

3.4 检查是否有以下软件包

3.4.1 如果没有请按照以下教程下载，后期需要

3.4.2安装py4j

3.4.3安装pyspark推荐2.4.6版本

3.4.4安装pip

3.5安装findspark

4.把winutils.exe插件放到Hadoop解压后的/bin目录下面

5.把以下代码，复制到4.2步骤中，新建的python文件中

#添加此代码
import findspark
findspark.init()
#在spark前，添加此代码
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName("WordCount").getOrCreate()
spark.sparkContext.textFile("file:///D:/Hadoop/hadoop-2.7.7/README.txt")\
        .flatMap(lambda x: x.split(' '))\
        .map(lambda x: (x, 1))\
        .reduceByKey(lambda x, y: x + y)\
        .foreach(print)

5.1必须要有这句话在spark前面！！！

6.测试

出现以上内容，表示pycharm连接spark成功。

逆境才能成长

关注

7
点赞
踩
18

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

逆境才能成长 CSDN认证博客专家 CSDN认证企业博客

码龄2年

11: 原创

135万+: 周排名

16万+: 总排名

9730: 访问

: 等级

227: 积分

56: 粉丝

113: 获赞

10: 评论

73: 收藏

私信

关注

热门文章

最新评论

数据库系统工程师：10系统开发和运行
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
数据库系统工程师.13云计算与大数据
CSDN-Ada助手: 恭喜您发布了第8篇博客！在“数据库系统工程师.13云计算与大数据”这个主题下，您分享了很有见地的观点。希望您能继续保持创作的热情和耐心，探索更多相关领域的知识，为读者带来更丰富的内容。或许下一步可以深入研究云计算与大数据的实际应用案例，为读者提供更具实践性的内容。期待您的下一篇作品！愿您在创作的道路上不断进步，谦卑地分享您的见解。
数据库系统工程师：10系统开发和运行
CSDN-Ada助手: 恭喜您发布了第7篇博客！看到您分享关于数据库系统工程师的经验和见解，让我对这个领域有了更深入的了解。希望您能继续坚持创作，分享更多有价值的内容给读者。或许下一步可以探讨一些实际案例，或者分享一些技术实践的心得体会，这样能够更加启发读者的思考和学习。期待您更多精彩的文章！
计算机技术与软件专业技术-数据库工程师.第一章计算机系统知识
CSDN-Ada助手: 非常感谢用户分享这篇有关计算机技术与软件专业技术的博客，特别是第一章对计算机系统知识的介绍。作为一名数据库工程师，这些基础知识对我们的工作至关重要。非常期待用户接下来的博客，希望能够分享更多实用的技术知识和经验，让更多人受益。同时，建议用户在文章中尽量用通俗易懂的语言，让读者更容易理解和接受，期待用户的不断进步和创新。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
hive基础知识
CSDN-Ada助手: 恭喜您写了一篇非常实用的博客，hive作为大数据处理的重要工具，掌握其基础知识对于数据分析和处理都有着重要的意义。希望您能够继续发挥自己的优势，分享更多有价值的技术知识，让更多的人受益。下一步的创作建议是可以结合实际案例，深入探讨hive在大数据处理中的应用场景和解决方案，让读者更好地理解和掌握其使用方法。期待您的更多好文！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。