大数据——Mapreduce学习总结

概述

Mapreduce是一种分布式并行编程:借助一个集群通过多台机器同时并行处理大规模数据集。
在这里插入图片描述

Mapreduc模型简介

Mapreduce采用分而治之的方法实现,把非常庞大的数据集,切分成非常多的独立的小片,然后单独的启动一个Map任务,最终通过多个map,并行的在多个机器上去处理

Mapreduce理念

计算向数据靠拢而不是数据向计算靠拢
要完成一次数据分析,选择一个计算节点把运行数据分析的程序放到计算节点上运行;然后把它所涉及的数据,全部从各个节点面上拉过来,传输到计算发生的地方。

Mapreduce采用了Master/slave架构:一个Master服务器个若干个slave服务器。Master上与新作业跟踪器jobTracker,slave服务器负责基本任务的组件TaskTracker.

Mapreduce的体系结构

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值