Spark环境搭建

最新推荐文章于 2022-11-22 09:09:47 发布

hellohorizon

最新推荐文章于 2022-11-22 09:09:47 发布

阅读量562

点赞数

分类专栏：大数据/云计算文章标签： spark Spark环境搭建

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yanhang0610/article/details/51899161

版权

大数据/云计算专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1 系统环境

系统：CentOS 6.5 32bit。

版本：JDK 1.7，Hadoop 2.6.4，Spark 1.6.2，Scala 2.10（Spark1.6.2匹配Scala2.10版本）。

2 Hadoop环境搭建

参考《Hadoop环境搭建》进行hadoop环境搭建。

3 Scala环境配置

3.1 下载Scala

下载合适版本Scala，注意与Spark版本相匹配：

http://www.scala-lang.org/download/all.html

3.2 安装

解压即完成安装：

tar -xzvf scala-2.10.6.tgz

解压后可移动至合适位置。

3.3 设置环境变量

3.3.1 新建Scala的环境变量配置

vi /etc/profile.d/scala.sh

内容如下：

export SCALA_HOME=/xxx/.../scala-2.10.6

export PATH=$SCALA_HOME/bin:$PATH

3.3.2 给scala.sh分配权限

chmod 755 /etc/profile.d/scala.sh

3.3.3 使配置生效

. /etc/profile

测试代码：

HelloWorld.scala

object HelloWorld {

def main(args: Array[String]) {

println("hello world with scalain linux");

}

}

4 Spark安装配置

集群服务器配置以Hadoop配置为准。

4.1 安装

4.1.1 下载

到官网http://spark.apache.org/downloads.html 下载合适版本到自定路径。

4.1.2 解压

解压即完成安装：

tar -zxvf spark-1.6.2-bin-without-hadoop.tgz

解压后可移动至合适位置。

4.2 创建配置文件和脚本

进入安装目录下的conf文件夹，创建如下两个文件：

cp spark-env.sh.template spark-env.sh

cp spark-defaults.conf.templatespark-defaults.conf

4.3 配置spark-env.sh

设置如下配置：

#export JAVA_HOME=/usr/java/jdk1.7.0_51 #若配置过则不再配，下同

#export SCALA_HOME=/xxx/.../scala-2.10.6

#export HADOOP_HOME=/usr/local/hadoop-2.7.0

exportHADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export SPARK_DIST_CLASSPATH=$(hadoopclasspath) #需预先配置HADOOP_HOME环境变量

export SPARK_MASTER_IP=192.168.1.100

export SPARK_WORKER_MEMORY=512m

export master=spark://192.168.1.100:7070

4.4 配置slaves

每行一个IP地址或主机名。

4.5 启动

先启动Hadoop集群。

4.5.1 在Spark根目录启动Spark

./sbin/start-all.sh

启动成功后，可以通过http://master:8080/ 访问集群环境，通过http://master:4040/jobs/查看jobs等信息。

关闭：

./sbin/stop-all.sh

4.5.2 进入spark-shell

./bin/spark-shell

4.5.3 运行自带示例

./bin/run-exampleSparkPi 10

4.6 验证

运行命令jps查看进程：

jps

4.6.1 服务器nn（spark的master节点）

xxxx Jps

xxxx Master

xxxx NameNode

xxxx SecondaryNameNode

xxxx ResourceManager

5 常见问题

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Spark环境搭建

1 系统环境系统：CentOS 6.5 32bit。版本：JDK 1.7，Hadoop 2.6.4，Spark 1.6.2，Scala 2.10（Spark1.6.2匹配Scala2.10版本）。2 Hadoop环境搭建参考《Hadoop环境搭建》进行hadoop环境搭建。3 Scala环境配置3.1 下载Scala 下载合适版
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。