搭建单机伪分布式Hadoop+spark+scala

目录

 

安装伪分布式hadoop

安装 JAVA 环境

实现免密登陆

Hadoop环境的安装与配置

安装伪分布式spark

 安装伪分布式scala


 

安装伪分布式hadoop

安装 JAVA 环境

步骤一:下载 JDK 安装包(jdk-8u152-linuxx64.tar.gz)

官网地址:https://www.oracle.com/java /technologies /javase-jdk8-downloads.html

步骤二:卸载自带 OpenJDK

[root@master ~]# rpm -qa | grep java

卸载相关服务,键入命令 rpm –e –-nodeps 删除的包

 [root@master ~]# rpm -qa | grep java

[root@master ~]# java --version

bash: java: 未找到命令

46345ec621cf434e96ad753cbb6a0f1b.png

步骤三:安装 JDK

安装命令如下,将安装包解压到/usr/local/src 目录下,将安装包放在了root目录下

[root@master ~]# tar -zxvf jdk-8u152-linux-x64.tar.gz -C /usr/local/src/

[root@master ~]# ls /usr/local/src/
jdk1.8.0_152

928613de6afa4c7e943561a3d23f616a.pngbc8bdfd1e08d4547b920955d8ca2aa87.pngd741cfc4d41a4e5b94c3386e8cf9e331.png

步骤四:设置 JAVA 环境变量

[root@master ~]# vi /etc/profile

在文件的最后增加如下两行:

export JAVA_HOME=/usr/local/src/jdk1.8.0_152

export PATH=$PATH:$JAVA_HOME/bin

执行 source 使设置生效:

[root@master ~]# source /etc/profile

检查 JAVA 是否可用。

[root@master ~]# echo $JAVA_HOME /usr/local/src/jdk1.8.0_152

[root@master ~]# java -version

java version "1.8.0_152"

Java(TM) SE Runtime Environment (build 1.8.0_152-b16)

Java HotSpot(TM) 64-Bit Server VM (build 25.152-b16, mixed mode)

能够正常显示 Java 版本则说明 JDK 安装并配置成功。

10dd51ba4c6b47748075b377211fdc8b.png

实现免密登陆

步骤一:创建ssh秘钥,输入如下命令,生成公私密钥

[root@master ~]# ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

 

步骤二:将master公钥id_dsa复制到master进行公钥认证,实现本机免密登陆,测试完exit退出

[root@master ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub master

[root@master ~]# ssh master

[root@master ~]# exit

 

Hadoop环境的安装与配置

步骤一:将/root/runajian下的hadoop-2.7.7.tar.gz压缩包解压到/opt目录下,并将解压文件改名为hadoop

 

步骤二:修改环境变量

[root@master ~]# vim /etc/profile

export HADOOP_HOME=/opt/hadoop

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

[root@master ~]# source /etc/profile 

5f319070a9f74f069a0b3b767ee4d787.png

步骤三:编辑/opt/hadoop/etc/hadoop/hadoop-env.sh文件

[root@master ~]# vi /opt/hadoop/etc/hadoop/hadoop-env.sh

修改配置文件为jdk的安装路径:

export JAVA_HOME=/usr/local/src/jdk1.8.0_152
6f7d3de997004cedafd73fcc5b00b57f.png

步骤四:编辑/opt/hadoop/etc/hadoop/core-site.xml文件

[root@master ~]# vi /opt/hadoop/etc/hadoop/core-site.xml
修改配置文件为:

<configuration>

<property>
<name>fs.defaultFS</name>
<value>hdfs://master</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop/tmp</value>
</property>
</configuration>

步骤五:编辑/opt/hadoop/etc/hadoop/hdfs-site.xml文件

[root@master ~]#  vi /opt/hadoop/etc/hadoop/hdfs-site.xml

修改配置文件:

<configuration>

<property>
<name>dfs.replication</name>
<value>3</value>
</property>

</configuration>

步骤六:

复制/opt/hadoop/etc/hadoop/mapred-site.xml.tmplate 名为mapred-site.xml 

[root@master ~]# cp /opt/hadoop/etc/hadoop/mapred-site.xml.template /opt/hadoop/etc/hadoop/mapred-site.xml

编辑/opt/hadoop/etc/hadoop/mapred-site.xml文件

[root@master ~]# vi /opt/hadoop/etc/hadoop/mapred-site.xml
修改配置为:

<configuration>

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

步骤七:编辑/opt/hadoop/etc/hadoop/yarn-site.xml文件

[root@master ~]# vi /opt/hadoop/etc/hadoop/yarn-site.xml

修改配置为:

<configuration>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

</configuration>

 步骤八:编辑/opt/hadoop/etc/hadoop/slaves文件

[root@master ~]# vim /opt/hadoop/etc/hadoop/slaves
4c361d8b47c24d4fb3bfb39236f78329.png

步骤九: 格式化hdfs

[root@master ~]# hdfs namenode -format
6fbfc877950e497fab7c06e04325fcb0.png

 步骤十:启动集群 jps查看,登录网页

[root@master ~]# start-all.sh

[root@master ~]# jps
c30592babeaf4282863bc5517f7ded61.png

在浏览器的地址栏输入http://master:50070,进入页面可以查看NameNode和DataNode 信息 

44283b615db1451bb8dbb79b32d964ce.png

安装伪分布式spark

步骤一:安装命令如下,将安装包解压到/usr/local目录下,将安装包放在了root目录下

[root@master ~]# tar -zxf spark-2.0.0-bin-hadoop2.6.tgz -C /usr/local/

cff36314c9ca49acb84e50ecbb202ced.png

步骤二:复制和重命名后得到spark-env.sh,打开spark-env.sh添加内容

[root@master bin]# cd /usr/local/spark-2.0.0-bin-hadoop2.6/conf/

[root@master conf]# cp spark-env.sh.template spark-env.sh
[root@master conf]# vi spark-env.sh

export JAVA_HOME=/usr/local/src/jdk1.8.0_152
export HADOOP_HOME=/opt/hadoop
export HADOOP_CONF_DIR=/opt/hadoop/etc/hadoop
export SPARK_MASTER_IP=master
export SPART_LOCAL_IP=master

547bb4c803d6482d84c13198f408d0cb.png

步骤三:进入spark目录的/sbin下启动spark集群,jps查看

[root@master conf]# cd /usr/local/spark-2.0.0-bin-hadoop2.6/sbin/
[root@master sbin]# ./start-all.sh
[root@master sbin]# jps

de84538674a945c79d37dab2d2fa740c.png

步骤四:启动spark-ahell

[root@master ~]# cd /usr/local/spark-2.0.0-bin-hadoop2.6/
[root@master spark-2.0.0-bin-hadoop2.6]# ./bin/spark-shell


209de574ab094a8d8fb5c210b182012a.png

步骤五:查看网页http://master:8080

82ad7b12a01e4aeb98812ef03e2c9fda.png

 安装伪分布式scala

步骤一:安装命令如下,将安装包解压到/usr/local目录下,将安装包放在了root目录下

[root@master ~]# tar -zxf scala-2.11.8.tgz -C /usr/local

 6fa1591fd55b4361abc138bec9bd60c3.png

步骤二:配置scala环境变量,重新加载配置文件,运行scala

[root@master ~]# vim /etc/profile

 

export SCALA_HOME=/usr/local/scala-2.11.8
export PATH=$PATH:$SCALA_HOME/bin

265d78ce423f48ea8659b1585d3ef831.png

 [root@master ~]# source /etc/profile
[root@master ~]# scala
Welcome to Scala 2.11.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_152).
Type in expressions for evaluation. Or try :help.

8af673dec1b34ac392d6e732796d4ca8.png

分布式hadoop大数据sparkscala

发布于2024-04-25著作权归作者所有

  • 28
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值