Hadoop 和 MapReduce的优点

灯下晚归人cc

已于 2022-01-26 12:54:27 修改

阅读量1.6k

点赞数

文章标签： hadoop mapreduce 大数据

于 2022-01-26 12:53:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_58003121/article/details/122699376

版权

Hadoop

hadoop中的3个分布式

HDFS 分布式文件存储系统

Mapreduce 分布式计算框架

YARN 分布式资源调度器

大数据云计算 hadoop 关系

大数据是云计算的产物，底层是hadoop

云计算3S

iaas 基础设施及服务

paas平台及服务

Saas 软件及服务

HDFS中的3个Node

nameNode 名字节点（系统快照FSImage 编辑日志editLog）

secondaryNameNode editLog.new

dataNode 数据节点

5.2个机制

副本机制：每个dataNode的数据默认有2个备份

心跳机制：nameNode定期向dataNode发送数据包，如果超过时长不返回再开一台

如果存储数据

切成块 block 默认1.x 64MB 2.x 128MB

如何访问HDFS

http://ip:50070 /http://master:50070

Shell命令行操作hdfs

Put -》hadoop fs -put 文件名 /路径

Cat -》hadoop fs -cat 文件名

Rm -r -》hadoop fs -rm -r 文件名

Mkdir -> hadoop fs -mkdir -p /aa/bb

MR(MapReduce)

概念分而治之，map（映射） reduce（归并）
执行流程图.

两个组件 Combinner

合成器作用类似于Reduce 提前一步归并

Partitioner

分区：将相同key 放到不同的reduce中

特点：

数据量大

运算速度慢

文件存储 HDFS

扩展性强

适用于海量数据离线计算机

灯下晚归人cc

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop 和 MapReduce的优点

Hadoophadoop中的3个分布式HDFS 分布式文件存储系统Mapreduce 分布式计算框架YARN 分布式资源调度器大数据云计算 hadoop 关系大数据是云计算的产物，底层是hadoop云计算3Siaas 基础设施及服务paas平台及服务Saas 软件及服务HDFS中的3个NodenameNode 名字节点（系统快照FSImage 编辑日志editLog）secondaryNam...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。