Spark1.6.0 on Hadoop-2.6.3 安装配置

最新推荐文章于 2023-03-01 11:28:57 发布

易悠

最新推荐文章于 2023-03-01 11:28:57 发布

阅读量2.1k

点赞数 7

分类专栏： Spark Hadoop 大数据云计算 Spark Learning 文章标签： scala spark

本文链接：https://blog.csdn.net/yizheyouye/article/details/50517013

版权

Spark 同时被 3 个专栏收录

48 篇文章 0 订阅

订阅专栏

云计算

39 篇文章 0 订阅

订阅专栏

大数据

21 篇文章 0 订阅

订阅专栏

安装配置Scala

1 下载scala
下载解压scala包：略
附：下载链接
http://www.scala-lang.org/download/2.10.4.html

移动scala到指定目录

mkdir /usr/local/scala

mv scala-2.10.4 /usr/local/scala

这里写图片描述
2 配置scala环境变量

export SCALA_HOME=/usr/local/scala/scala-2.10.4

export PATH=${JAVA_HOME}/bin:${HADOOP_HOME}/bin:${SCALA_HOME}/bin:$PATH

这里写图片描述
source .bashrc 使配置生效，显示安装的scala版本

3 测试scala运行环境

输入scala进入scala环境：

测试：12*12 回车

这里写图片描述

安装配置Spark1.6.0

1 下载Spark1.6.0
根据Hadoop选择对应版本下载Spark
这里写图片描述

附：下载链接

http://spark.apache.org/downloads.html

将下载解压后的spark移动到指定目录(/usr/local/spark)

mkdir /usr/local/spark

mv spark-1.6.0-bin-hadoop2.6 /usr/local/spark

这里写图片描述
2 配置Spark环境变量

export SPARK_HOME=/usr/local/spark/spark-1.6.0-bin-hadoop2.6

export PATH=${JAVA_HOME}/bin:${HADOOP_HOME}/bin:${SCALA_HOME}/bin:${SPARK_HOME}/bin:$PATH

这里写图片描述

注：source .bashrc 使配置生效

3 配置Spark

cp spark-env.sh.template spark-env.sh

vim spark-env.sh

这里写图片描述

添加SPARK配置信息

    export JAVA_HOME=/usr/lib/java8/jdk1.8.0_65
    export SCALA_HOME=/usr/local/scala/scala-2.10.4
    export SPARK_MASTER_IP=hjr
    export SPARK_WORKER_CORES=2
    export SPARK_WORKER_MEMORY=1g
    export HADOOP_CONF_DIR=/usr/local/hadoop/hadoop-2.6.3/etc/hadoop

这里写图片描述

cp slaves.template slaves

vim slaves

注意 IP 地址：

这里写图片描述

添加节点：
hjr 或者 127.0.1.1

这里写图片描述

4 启动Spark，查看集群状况

cd /usr/local/spark/spark-1.6.0-bin-hadoop2.6

启动：
./start-all.sh

jps查看进程：多了一个Master和Worker进程

这里写图片描述

启动：spark-shell

这里写图片描述

测试运行：

val file=sc.textFile("hdfs:/hjr/hdfs-site.xml")

这里写图片描述

val count=file.flatMap(line=>line.split(" ")).map(word=>(word,1)).reduceByKey(_+_)

这里写图片描述

count.collect

这里写图片描述

Spark UI：
这里写图片描述

这里写图片描述

附：Spark History Server 配置

vim /conf/spark-defaults.conf

spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://localhost:9000/SparkHistoryServerLogs
spark.history.ui.port            18088
spark.history.fs.logDirectory    hdfs://localhost:9000/SparkHistoryServerLogs

vim spark-env.sh

起作用：(localhost：9000 — 路径和hadoop配置文件core-site.xml对应)

export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18088 -Dspark.history.fs.logDirectory=hdfs://localhost:9000/SparkHistoryServerLogs"

hadoop fs -mkdir /SparkHistoryServerLogs

易悠

关注

7
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录