大数据论文_02_MapReduce(个人总结)

hellosrc2023

已于 2022-03-30 15:54:47 修改

阅读量1.9k

点赞数

分类专栏：大数据文章标签： hadoop 大数据

于 2022-03-28 23:51:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46141936/article/details/123809948

版权

大数据专栏收录该内容

39 篇文章 11 订阅

订阅专栏

    声明: 1. 本文为我的个人复习总结, 并非那种从零基础开始普及知识 内容详细全面, 言辞官方的文章
              2. 由于是个人总结, 所以用最精简的话语来写文章
              3. 若有错误不当之处, 请指出

MapReduce

目的:

让开发人员意识不到分布式的存在

架构:

Master (JobTracker)

Worker (TaskTracker: MapTask, ReduceTask)

三个问题:

简单易用:
- 只有 Map 和 Reduce, 增加机器数量即可提高计算性能
- 有Counter记录日志便于debug
  
  利用这个计数器，去统计有多少输入日志的格式和预期的不一样。如果比例太高，那么多半程序就有 Bug
容错:

对错误数据视而不见, 直接重试处理即可, 认为UV 10000 和 9999 没区别
- 对于 Worker 节点的失效
  
  MapReduce 框架解决问题的方式非常简单, 就是换一台服务器重新执行任务
- 对于 Master 节点的失效
  
  Master 节点失败了也就是整个 MapReduce 任务失败了, 那么只需要重新提交任务进行重试
性能:
- Combiner
- 计算程序向数据移动, 而不是数据向计算程序移动

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据论文_02_MapReduce(个人总结)

    声明: 1. 本文为我的个人复习总结, 并非那种从零基础开始普及知识 内容详细全面, 言辞官方的文章              2. 由于是个人总结, 所以用最精简的话语来写文章           
复制链接

扫一扫

专栏目录

hellosrc2023 CSDN认证博客专家 CSDN认证企业博客

码龄5年

61: 原创

7万+: 周排名

98万+: 总排名

12万+: 访问

: 等级

831: 积分

94: 粉丝

87: 获赞

23: 评论

607: 收藏

私信

关注

热门文章

分类专栏

大数据 39篇
MySQL 2篇
Linux 4篇
Hadoop 4篇
操作系统
Java 2篇
maven 1篇
HBase 1篇
JUC 1篇
Java基础 4篇
Hive 1篇
Redis 1篇
JavaSE 1篇
设计模式 1篇
ZooKeeper 1篇
Scala 1篇
ClickHouse 1篇
Sqoop 1篇
JVM 1篇
Flume 1篇

最新评论

大数据软件安装配置教程[Linux, JDK, MySQL, Hadoop, ZooKeeper, Hive, Flume, Kafka, HBase-Phoenix, Scala, Spark等等]
lhl1276886028:
Flink_10_CDC(个人总结)
ETLCloud数据集成社区: 文章很详细，感谢博主讲解，我们企业最近新出了ETLCloud数据集成工具，如果是想要快速实现数据库CDC操作，ETLCloud也能实现flink cdc的效果，在增量同步、断点续传、全量同步的表现都很好，也支持全增量一体化同步，欢迎博主去体验下，也可以加入我们的社区，一起交流下，提提不同的建议！互相学习下
Flink_10_CDC(个人总结)
hellosrc2023: 好的，那看来是误会。因为每个人说话语气的程度 & 对语言评判的程度都不同，千人千面就会产生误会，互相改善即可。
Flink_10_CDC(个人总结)
隔壁_小王: 如果你觉得我攻击了你，那我在这里说句不好意思，我觉得我只是正常交流
Flink_10_CDC(个人总结)
隔壁_小王: “若有错误不当之处, 请指出”，这句是你自己说的吧，而且我只是说你没了解清楚，就发博文了，我没攻击你吧，我怎么就不友好了。。。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。