python环境的spark单机环境搭建

会发paper的学渣

已于 2022-04-19 18:42:25 修改

阅读量505

点赞数

分类专栏：推荐文章标签： spark

于 2022-04-01 15:55:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sslfk/article/details/123899383

版权

推荐专栏收录该内容

17 篇文章 1 订阅

订阅专栏

1、安装python

2、pip install pyspark==2.4.4

3、安装java:jdk1.8

4、安装hadoop 2.8.2

5、如果是window环境，需要下载https://github.com/srccodes/hadoop-common-2.2.0-bin

相关bin代码，并将其内文件覆盖hadoop的bin路径对应文件中

配置环境变量：

HADOOP_HOME：hadoop的bin上一层目录

JAVA_HOME:java的bin上层目录

配置path:%HADOOP_HOME%\bin;%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin

然后执行如下代码：

#!/usr/bin/python
# coding=utf-8
import traceback

from pyspark import SparkContext

try:
    print("begin")
    sc = SparkContext(appName="IIP_Recommend_System", master="local")

    words = sc.parallelize(
        ["scala",
         "java",
         "hadoop",
         "spark",
         "akka",
         "spark vs hadoop",
         "pyspark",
         "pyspark and spark"
         ])
    counts = words.count()
    print(counts)
    '''
    The Start!
    '''
    sc.stop()
except:
    traceback.print_exc()

其中，python和pyspark的对应关系为：

pyspark	python
<2.4.4	<=3.6
2.4.4=<version<3	<=3.7
version>=3	<=3.8

如果要支持kafka的话，需要python的包依赖环境的Lib\site-packages\pyspark\jars目录中添加spark-streaming-kafka-0-8-assembly_2.11-2.3.1.jar（其他版本暂时未使用）

会发paper的学渣

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
python环境的spark单机环境搭建

1、安装python2、pip install pyspark==2.2.13、安装java:jdk1.83、安装hadoop 2.8.2
复制链接

扫一扫

专栏目录

会发paper的学渣 CSDN认证博客专家 CSDN认证企业博客

码龄13年

190: 原创

5万+: 周排名

2万+: 总排名

31万+: 访问

: 等级

2176: 积分

149: 粉丝

203: 获赞

89: 评论

913: 收藏

私信

关注

热门文章

分类专栏

elasticsearch 16篇
深度学习基础 24篇
tensorflow2.x 39篇
NLP 29篇
搜索 9篇
推荐 17篇
大模型 1篇
linux 8篇
python3 23篇
问题
模型训练 4篇
ocr 1篇
联想 2篇
neo4j 1篇
知识图谱 7篇
kafka 2篇
tfrs 1篇
pandas 2篇
加密算法 2篇
springcloud 1篇
awk 1篇
springboot继承 1篇
大数据算法 4篇
传统算法
札记 11篇
spark学习 3篇

最新评论

basicsr 安装问题
sad209: pip install torch=这里少了个等于号2.1.2 torchvision==0.16.2 -i https://download.pytorch.org/whl/cu118
elasticsearch 关于向量化检索
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
cube-studio 部署过程
源泉775: 道友，你弄出来了吗
wave2lip训练
weixin_45561370: 你好，请问一下你生成那三个文件了吗
数据集下载渠道汇总
m0_62196601: https://computenest.console.aliyun.com/user/dataset/cn-hangzhou 阿里云的「计算巢」产品现已更新，增添了多个热门中文数据集，以便大家能够更便捷地进行数据分析和机器学习项目。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

会发paper的学渣 您的鼓励和将是我前进的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。