linux环境安装pyspark

本文档介绍了如何在Ubuntu 18.04系统上安装PySpark,包括Java 8、Scala的安装,Py4J的配置,Spark的下载与环境变量设置,以及启动pyspark和在Jupyter Notebook中使用PySpark的方法。
摘要由CSDN通过智能技术生成

操作系统:Ubuntu 18.04,64位。
所需软件: Java 8 +,Python 3.7 +, Scala 2.11.12+

安装步骤:
Step 1: Java 8安装

sudo apt-get update
sudo apt-get install openjdk-8-jdk
java -version

安装成功后,会显示如下画面:
在这里插入图片描述
Step 2: 如果Java安装完成后,我们安装Scala:

wget https://downloads.lightbend.com/scala/2.12.8/scala-2.12.8.deb
sudo dpkg -i scala-2.12.8.deb
scala -version

安装成功后,会显示如下画面:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
要在Linux安装Pyspark,你可以按照以下步骤进行操作: 1. 首先,下载并解压Pyspark。你可以使用wget命令下载Pyspark的压缩包,例如:wget http://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.4.4/spark-2.4.4-bin-hadoop2.7.tgz。然后使用tar命令解压压缩包,例如:tar -zxvf spark-2.4.4-bin-hadoop2.7.tgz。 2. 将解压后的Pyspark文件夹移动到你想要安装的位置。例如,你可以使用mv命令将文件夹重命名为spark,并将其移动到/usr/local目录下,即:mv spark-2.4.4-bin-hadoop2.7.tgz spark。 3. 编辑/etc/profile文件,将Pyspark的路径添加到环境变量中。你可以在文件末尾添加以下两行命令: export SPARK_HOME=/usr/local/spark export PATH=$PATH:$SPARK_HOME/bin 同时,你还可以添加SPARK_PYTHON变量来指定Pyspark使用的Python编译器,例如:export SPARK_PYTHON=/usr/local/bin/python3。 4. 刷新配置文件,使其生效。你可以运行source /etc/profile命令来刷新配置文件。 5. 验证Pyspark安装是否成功。你可以打开终端并运行pyspark命令来启动Pyspark。如果一切正常,你将看到类似以下信息的输出: Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties Setting default log level to "WARN". To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel). Welcome to ____ __ / __/__ ___ _____/ /__ _\ \/ _ \/ _ `/ __/ '_/ /___/ .__/\_,_/_/ /_/\_\ version 3.2.0 /_/ Using Python version 3.7.7 (default, Jan 28 2022 17:56:52) Spark context Web UI available at http://VM-20-8-centos:4040 Spark context available as 'sc' (master = local[*], app id = local-1643543698074). SparkSession available as 'spark'. 这样,你就成功地在Linux安装Pyspark。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Linux服务器下PySpark环境安装](https://blog.csdn.net/js010111/article/details/122755433)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Linux 安装 pySpark](https://blog.csdn.net/m0_55389447/article/details/122658477)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

山河念远之追寻

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值