hadoop整理（一）：hadoop的安装

最新推荐文章于 2024-10-31 11:02:47 发布

yolandaxym

最新推荐文章于 2024-10-31 11:02:47 发布

阅读量118

点赞数

分类专栏： hadoop 文章标签： hadoop hadoop安装

本文链接：https://blog.csdn.net/weixin_41234306/article/details/88361373

版权

2 篇文章 0 订阅

订阅专栏

本文详细介绍Hadoop集群的搭建过程，包括Java JDK的安装、环境变量配置、Hadoop组件安装与配置，以及核心参数调整。同时，文章还介绍了如何关闭Linux防火墙、格式化Hadoop、启动服务，并在Windows上通过HTTP访问HDFS的Web页面。

摘要由CSDN通过智能技术生成

一、安装

安装Java的jdk

把bin放到环境变量里，即修改 profile文件 vi /etc/profile
在末端加入：

export JAVA_HOME = （jdk的路径）
export PATH= $P A T H :$ JAVA_HOME/bin

使修改生效： source /etc/profile
安装hadoop

在 /etc/hadoop里改配置：

hdfs-site.xml

 	<name>hfs.replication</name> #指定副本数
 	<value>3</value> #一般值为3

除此之外，还可以指定块的大小。

mapred-site.xml.template

<name>mapreduce.framework.name</name>
<value>yarn</value>

指定MapReduce在yarn上面去跑

yarn-site.xml
yarn.sourcemanager.hostname 指定yarn的老大
yarn.nodemanager.aux-services 的值为mapreduce_shuffle，这是指定reduce获取数据的方式

关Linux防火墙
centos7要使用 systemctl stop firewalld.service #启动用start
还要禁止开机自动启动防火墙的功能： systemctl disable firewalld.service
格式化
第一次启动hadoop的时候要初始化一下
要把hadoop下的sbin目录也添加到PATH里（bin目录也要）
格式化命令： hadoop namenode -format

注：namenode在/data/name里管理主机和块之间的映射关系
启动
命令： cd app/hadoop-2.4.1/sbin/
新手不建议start-all
所以先 start-dfs.sh，再start-yarn.sh

修改Windows的host文件（在system32/dirvers/etc 里面），把hostname和ip地址加进去）

修改host文件的方法：用管理员身份打开命令提示符，输入 notepad，在记事本里打开host进行修改保存。

这样我们就可以在Windows上，用 http://hostname:50070 进入HDFS的web页面

往这里上传文件： hadoop fs -put xxxx.txt hdfs://hostname:9000/ # 末端一定是/，否则出错