搭建单机版伪分布式Hadoop+Spark+Scala

一、前期准备

1.1 关闭防火墙和selinux

92b9ed20fbe84cf7be07c9b31cefa73c.png

22f3ea9727a6429db79a90896997fbac.png

1.2 修改IP与主机映射

b6c5b8ebca0e4f3f8f52ff74e22709fd.png

5f37ba130347419eab0a9c0285d1d514.png

二、安装JAVA环境

2.1 卸载自带 OpenJDK

116fcbb166c645669c73c8a31dafd4a1.png

2.2 将安装包解压到/usr/local/src 目录下

59709e1f06494aada9e88dd1512ffc68.png

2.3 设置 JAVA 环境变量

e3c52e02d8de489ba62a9f85fa57ee50.png

在文件的最后增加如下两行:

export JAVA_HOME=/usr/local/src/jdk1.8.0_152

export PATH=$PATH:$JAVA_HOME/bin

执行 source 使设置生效:

5faa7234748a403aa0b9a8e29c7ca5c7.png

5e15ed1e44a3457aab94d07686545e07.png

检查 JAVA 是否可用

1c731d392ff04c9597e1aa80fa4cb3c9.png

三、实现免密登陆

3.1 创建ssh秘钥,输入如下命令,生成公私密钥

3.2 将master公钥id_dsa复制到master进行公钥认证,实现本机免密登陆,测试完exit退出

06db09287edc454191a36e126fe5ae4d.png

四、搭建伪分布式Hadoop

4.1 将/root下的hadoop-2.7.1.tar.gz压缩包解压到/opt目录下,并将解压文件改名为hadoop

9463bbe4b57d4b728efe0c3c7413bcf7.png

a9c2ef6e3cf64db285941c9802b77df8.png

4.2 修改环境变量,source生效

5e15ed1e44a3457aab94d07686545e07.png

bb1afbbb8f714a41955d8fdf497f17f4.png

66d2977ee304414697a3657569548d62.png

4.3 编辑hadoop-env.sh文件

cd /opt/hadoop/etc/hadoop/

8cbd11fcc321471892802a5cd808778e.png

15aee67e46cd4f63afd91b35e7e4549c.png

4.4 core-site.xml

465692dc1b6941d68da7e97c542e926f.png

903d8bab938a4572846c65f5672850c1.png

4.5 hdfs-site.xml

b04472dba00241bca13a1fcd29a61ab2.png

28b0ca53d53e400a92c20a213a32deb8.png

4.6 mapred-site.xml

复制mapred-site.xml.tmplate 名为mapred-site.xml 

编辑mapred-site.xml文件

eacec6dd4b6f4af989f5647c74f58995.png

547f7decde624c7db8b6e8a6be92cf34.png

4.7 yarn-site.xml

e6ffc86bb2644c0791ad44c4d5e00d04.png

8ee705debcbc45ed9e18aaad89e60b7a.png

4.8 slaves

a11e3c3800ee4463bd5b02f94217beda.png

fd2aee030eb340fb961f8838b38cbcb9.png

4.9  格式化hdfs

08662f1c8f9b4a33ac509786a2265a25.png

4.10 启动集群 jps查看,登录网页

5adb0cfe93264be49f76fbb1677e39fa.png

在浏览器的地址栏输入http://master:50070,进入页面可以查看NameNode和DataNode 信息 

bc04b0bd03004cbd8398379fafb34d2b.png

五、搭建伪分布式spark

5.1 将安装包解压到/usr/local目录下

8297859ec0184f889bd41de4fb702b91.png

5.2 进入spark/conf目录,复制spark-env.sh.template得到spark-env.sh,打开spark-env.sh添加内容

eacb8c1e36bf482b95970ba0c93cd52e.png

b6116e90d3f44db190039d09c1ab7a6a.png

5.3 进入spark目录的/sbin下启动spark集群,jps查看

5973ce61d56f4c9fb70d7e6e75d3bae4.png

5.4 启动spark-shell

d505be9dda83489d908c479f1f8b4ab2.png

5.5 查看网页http://master:8080

7cd389150d8f417084499a56811b3a8c.png

六、搭建伪分布式scala

6.1 将安装包解压到/usr/local目录下

b199d90d93e54836b563b565b0348422.png

6.2 配置scala环境变量,重新加载配置文件

252557ed49aa42a08c2d796a463f1738.png

2a17a2910e284556888ce34e28481c45.png

6.3 运行scala

b734484d60804c489016d405a3ed1cf5.png

 

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值