Data mining - pyspark环境配置

在进行Data Mining之前,需要配置环境,包括JAVA、Python和Pyspark。JAVA安装简单,配置需要设置JAVA_HOME环境变量。Python通过官网下载并配置环境变量。Pyspark的安装涉及下载特定版本的Apache Spark,解压后配置环境变量,测试运行验证配置成功。
摘要由CSDN通过智能技术生成

前期准备

Data Mining 之前,进行环境的配置工作,我们使用Hadoop spark和Scala进行数据处理,安装之前我们需要了解所用的软件,Java, python,spark.

软件版本

JAVA:1.8
Python:3.6
Spark:2.3.3
Scala: 2.11

JAVA 安装与配置

安装

JAVA安装很简单
https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
官网下载,然后一系列同意,安装之后,就完成了。

配置

找到安装下的目录content里面有所需要的内容,记下路径。

打开terminal后:

touch ~/.bash_profile

然后输入相应的内容:

export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_161.jdk/Contents/Home
export PATH=$JAVA_HOME/bin:$SCALA_HOME/bin:$SCALA_HOME$PATH
export CLASSPATH="$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar"

JAVA_HOME就是之前下载的路径。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值