Centos下部署Hadoop2.6.5

最新推荐文章于 2024-07-16 05:41:11 发布

gan_ke

最新推荐文章于 2024-07-16 05:41:11 发布

阅读量688

点赞数 1

分类专栏：运维，互联网

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gan_ke/article/details/79634104

版权

本文详细介绍了在Centos6.5系统下部署Hadoop2.6.5的步骤，包括Hadoop的基本概念、HDFS优缺点、YARN组件解析，以及集群搭建过程，如环境配置、Hadoop安装、配置文件修改和启动Hadoop服务。在遇到JAVA_HOME环境变量问题时，提供了解决方案。最后，通过jps验证了集群的正常运行。

摘要由CSDN通过智能技术生成

Centos下部署Hadoop2.6.5

一、Hadoop简介

说到Hadoop，就必须先说说大数据，我们知道，大数据包括了以Hadoop和Spark为代表的基础大数据框架，其中又包括了实时数据处理、离线数据处理、数据分析、数据挖掘、机器算法、进行预测分析等技术。
这里写图片描述
那么Hadoop简单的说就是开源的大数据框架和分布式计算的解决方案（HDFS和MapReduce）

hdfs：

1.数据块：以块为存储单元（屏蔽了文件的概念，抽象），便于备份。
2.NameNode：管理文件系统的命名空间，存放数据元数据。
3.DataNode：存储并检索数据块，向NameNode更新存储块列表。

优点：

1.适合大文件存储，支持TB、PB级的数据存储
2.可以构建在廉价的机器上，并有一定的容错和恢复机制
3.支持流式数据访问，一次写入，多次读取

缺点：

1.不适合大量小文件存储
2.不适合并发写入，不支持文件随机修改
3.不支持随机读取等低延时的访问方式

在说MapReduce之前，先说说YARN

YARN

YARN是Hadoop2.x之后版本的资源管理器，负责资源的管理和调度，所有的MapReduce程序都需要通过YARN来进行调度。

ResourceManager

分配和调度任务
启动并监控ApplicationManager
监控NodeManager

ApplicationManager

为MR类型的程序申请资源，并分配个内部任务
负责数据的切分
监控任务的执行和容错

NodeManager

管理单个节点的资源
处理来自ResourceManager和ApplicationManager和命令

MapReduce 编程模型

输入一个大文件，通过split之后，将其分为多个分片，每个文件分片由单独的机器去处理，这就是Map方法；将各个机器计算的结果进行汇总并得到的最终的结果，这就是Reduce方法。

二、搭建Hadoop集群

1.环境

系统：Centos6.5
软件版本：Hadoop-2.6.5
集群架构：
master（NameNode）：192.168.239.138
slave1（DataNode）：192.168.239.139
slave2（DataNode）：192.168.239.140
ssh：主节点免密连接从节点
jdk：java-1.8.0

2.Hadoop安装

建立hadoop用户：
groupadd hadoop
useradd -g hadoop hadoop
passwd hadoop

安装jdk：
yum install -y java-1.8*
java -version
编辑/etc/profile，将JAVA_HOME加入环境变量，不然后面启动hadoop会报错
export JAVA_HOME=/usr/lib/jvm/java-1.8.0
保存后退出
source /etc/profile

下载和安装：
去Hadoop官网下载Hadoop-2.6.5，并解压到/usr/local：
tar xvf hadoop-2.6.5.tar.gz -C /usr/local/

修改目录的所有者和所属组：
chown -R hadoop.hadoop hadoop-2.6.5/
ln -s hadoop-2.6.5/ hadoop

接下来将hadoop目录下的bin加入到环境变量中：
export PATH=/usr/local/hadoop/bin:$PATH
source /etc/profile

测试hadoop 命令：
hadoop version

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。