Hadoop笔记

最新推荐文章于 2024-08-19 23:44:21 发布

爱敲代码的Dream

最新推荐文章于 2024-08-19 23:44:21 发布

阅读量82

点赞数

分类专栏：软件安装文章标签： hadoop hdfs mapreduce

本文链接：https://blog.csdn.net/weixin_45976114/article/details/121098654

版权

软件安装专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Hadoop笔记

一 Hadoop生态简要介绍

一 Hadoop生态简要介绍

1 Hadoop的组成

1.x 版本: HDFS（存） MapReduce(计算和资源调度)
2.x版本，3.x版本: HDFS（存）  MapReduce(计算)  Yarn（资源调度）

2 HDFS的架构

NameNode（nn） ：是HDFS的大哥,管理和从存储所有真实数据的元数据信息（文件名，文件大小，创建时间等）
DataNode（dn）：是HDFS的小弟，存储真实的数据，以快位单位 默认的块大小128m，比如一个200m的文件，分为2块:128m 72m
Second NameNode（2nn）：是NameNode的秘书，辅助NameNode干活，分担NameNode工作，减轻NameaNode的压力

3 Yarn的架构

ResourceManager（rm）：是Yarn的大哥，管理分配集群中所有的资源（来自于每个机器的资源）
NodeManager（nm）：是Yarn的小弟，管理所在机器的资源
ApplicationMaster（am）：每个Job都对于一个ApplicationMaster，主要负责Job的执行过程（资源申请，监控，容错等）
Container：对资源的抽象封装，防止资源被侵占

4 MapReduce的思想

Map（分）：将数据分到多台机器进行计算
Reduce（合）：将多台机器中运算的结果统一汇总

5 Hadoop的目录结构

bin ：Hadoop的命令
sbin：Hadoop的脚本
etc：Hadoop的配置文件
share：Hadoop的jar包

6.Hadoop的官方案例

grep：通过制定好的正则，匹配输入文件中满足规则的单词并输出

cd /opt/module/hadoop-3.1.3
mkdir input
cp etc/hadoop/*.xml input
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar grep input output 'dfs[a-z]+'
最后到output目录查看输出文件即可

wordcount ：统计输入文件中的每个单词出现的次数

cd /opt/module/hadoop-3.1.3
mkdir wcinput
cd wcinput
touch wc.txt
vim wc.txt
输入你想输的单词  最后保存
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount wcinput wcoutput
最后到wcoutput目录查看输出文件即可

爱敲代码的Dream

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop笔记

Hadoop笔记一 Hadoop生态简要介绍1 Hadoop的组成2 HDFS的架构3 Yarn的架构4 MapReduce的思想一 Hadoop生态简要介绍1 Hadoop的组成1.x 版本: HDFS（存） MapReduce(计算和资源调度)2.x版本，3.x版本: HDFS（存） MapReduce(计算) Yarn（资源调度）2 HDFS的架构NameNode（nn）：是HDFS的大哥,管理和从存储所有真实数据的元数据信息（文件名，文件大小，创建时间等）DataNode（dn
复制链接

扫一扫

专栏目录