学习大数据的第二天——hadoop的本地安装、伪分布安装和全分布式安装

最新推荐文章于 2024-09-30 09:51:27 发布

巨坑大数据

最新推荐文章于 2024-09-30 09:51:27 发布

阅读量103

点赞数

文章标签： linux install

本文链接：https://blog.csdn.net/nan3205/article/details/87775323

版权

1、hadoop本地安装

特点：没有HDFS和Yarn 只能够测试MapReduce程序是否成功，作为一个普通的Java程序

修改文件：vi /opt/module/hadoop_2.7.3/etc/hadoop/hadoop-env.sh,/opt/module/hadoop_2.7.3/etc/hadoop是hadoop的安装路径。修改hadoop-env.sh中的JAVA_HOME=/opt/module/jdk1.8.0_181。/opt/module/jdk1.8.0_181是jdk的安装路径。

2、hadoop伪分布式安装

特点：在一台机器上模拟一个分布式环境具备hadoop的所有功能

HDFS ： NameNode+DataNode+SecondarynameNode

Yarn：ResourceManager+NodeManager

修改文件：

1）vi hadoop-env.sh,JAVA_HOME=jdk路径

2）vi hdfs-site.xml

<property>
<name>dfs.replication</name>
<value>1</value>
   </property>

3) vi core-site.xml

<property>
   <name>fs.defaultFS</name>
   <value>hdfs://bigdata124:9000</value>
   </property>
   
   <property>
   <name>hadoop.tmp.dir</name>
   <value>/opt/moudle/hadoop-2.7.3/tmp</value>
   </property>

/opt/moudle/hadoop-2.7.3/tmp这个是HDFS数据块和元数据保存的目录，是自己创建的

4) vi mapred-site.xml

在hadoop解压后的文件夹中是没有mapred-site.xml文件的

首先 cp mapred-site.xml.template mapred-site.xml

再增加内容

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

5) vi yarn-site.xml

<property>
   <name>yarn.resourcemanager.hostname</name>
   <value>bigdata124</value>
</property>

<property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
</property>

6) 通过HDFS namenode格式化

命令：hdfs namenode -format

验证是否成功：Storage directory /opt/moudle/hadoop-2.7.3/tmp/dfs/name has been successfully formatted.

日志中是否出现上面这句

7) 最后启动

命令：start-all.sh

验证：jps

5314 SecondaryNameNode
5586 NodeManager
5476 ResourceManager
5126 DataNode
5878 Jps
5022 NameNode

主机web访问：http://配置虚拟机的ip:8088 -------------- yarn
http://配置虚拟机的ip:50070 ---------------- HDFS

3、ssh免密码登录

ssh不对称加密算法（加密和解密是两个文件）。（对称加密：加密和解密是同一个）

（1）生成密钥对：ssh-keygen -t rsa(三次回车）