从0开始学pyspark(一):ubuntu pyspark运行环境配置

本文档详述了如何在Ubuntu系统中从零开始配置PySpark环境,包括安装Java、Spark、PySpark以及Anaconda。通过遵循步骤,读者可以成功设置好运行PySpark所需的全部环境,并了解每个组件的验证方法。
摘要由CSDN通过智能技术生成

最近在研究spark,虽然windows下也能安装运行spark(亲测可行,但是开放9000端口还是连接不上docker上部署的hdfs),但是在windows下使用多有不便,于是安装了双系统(网上教程很多),如果在安装过程中出现卡死问题,可以看看这篇能不能解决 https://blog.csdn.net/tonydz0523/article/details/80532615

在ubuntu上配置环境比较简单:
1、安装java
2、安装spark

安装java

1、官网下载jdk的Linux包
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

这里写图片描述

下载最新的tar包,别忘了点accept license
2、sudo mkdir /usr/lib/jdk
3、系统默认下载到download文件夹,打开终端cd 到下载文件文件夹,或者文件管理器找到文件夹后右键打开终端
4、sudo tar -zxvf jdk-8u171-linux-x64.tar.gz -C /usr/lib/jdk
5、然后我们需要配置PATH路径,让jdk命令在任何路径下都能够直接执行
sudo gedit /etc/profile
没有安装gedit的可以 vi vim都行
在配置文件后加上

# java
export JAVA_HOME=/usr/lib/jd
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值