Linux下运行带有Spark依赖的Python脚本

最新推荐文章于 2024-05-29 17:33:36 发布

ClaireQi

最新推荐文章于 2024-05-29 17:33:36 发布

阅读量1.5k

点赞数

分类专栏： Spark # Linux 文章标签： Spark

本文链接：https://blog.csdn.net/wangxiao7474/article/details/81205426

版权

Spark 同时被 2 个专栏收录

6 篇文章 1 订阅

订阅专栏

Linux

5 篇文章 0 订阅

订阅专栏

在Python中，你可以把应用写成Python脚本，但是需要使用Spark自带的bin/spark-submit脚本来运行。spark-submit脚本会帮我们引入Python程序的Spark依赖。这个脚本为Spark的PythonAPI配置好了运行环境。

首先找到spark的安装目录，一般在Linux下，会将第三方软件安装到/opt目录下面。

然后运行下述指令：

/opt/spark/bin/spark-submit my_script.py

或者进入到spark的安装目录下面：

bin/spark-submit my_script.py

测试脚本：

from pyspark import SparkConf, SparkContext

conf = SparkConf().setMaster("local").setAppName("My App")
sc = SparkContext(conf = conf)

lines = sc.parallelize(["pandas", "cat", "i like pandas"])
word = lines.filter(lambda s: "pandas" in s)
print(word.collect())

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ClaireQi

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Linux下运行带有Spark依赖的Python脚本

在Python中，你可以把应用写成Python脚本，但是需要使用Spark自带的bin/spark-submit脚本来运行。spark-submit脚本会帮我们引入Python程序的Spark依赖。这个脚本为Spark的PythonAPI配置好了运行环境。首先找到spark的安装目录，一般在Linux下，会将第三方软件安装到/opt目录下面。然后运行下述指令：/opt/spark/b...
复制链接

扫一扫