liunx下的hadoop的简介与安装

本文介绍了Hadoop,一个用于大数据集处理的可靠、可伸缩的开源框架。它包含四个主要模块:Hadoop Common、HDFS、YARN和MapReduce。详细步骤指导了如何在Linux上安装Hadoop,包括配置JDK、解压安装包、修改配置文件以及启动Hadoop服务。
摘要由CSDN通过智能技术生成

Hadoop是一款可靠的、可伸缩的、分布式计算的开源软件。

是一个框架、允许跨越计算机集群的大数据集处理,使用简单的编程模型(MaoReduce)。

可从单个服务器扩展到几千台主机,每个节点提供了计算和存储的功能。而不是依赖高可

用性的机器,依赖于应用层面上的实现

Hadoop有四大模块

1.haddoop common  公共类库

2.HDFS hadoop        分布式文件系统

3.Hadoop yarn          作业调度和资源管理框架

4.Hadoop MapReduce  基于yarn系统的大数据集并行处理技术

       MapReduce工作原理如下:

5.Hadoop安装

(1).jdk(建议使用JDK1.8.11)

(2).tar hadoop.tar.gz(建议使用Hadoop2.6.0)

(3)将tar hadoop.tar.gz压缩文件复制到opt根目录下

(4)解压该压缩文件至指定目录下

(5)移动该文件到指定目录下

(6)修改配置文件

①修改hadoop-env.sh文件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值