MapReduce学习(一)、(二)

MapReduce是一种用于处理和生成大数据集的分布式并行编程框架。与传统的并行计算框架相比,MapReduce采用非共享架构,具有更好的容错性和横向扩展性。它通过Map和Reduce两个函数将大规模数据集切分成独立分片并行处理,减少网络传输开销。Map函数将输入数据解析成对,Reduce函数则对Map的中间结果进行聚合。MapReduce体系包括Client、JobTracker、TaskTracker和Task,负责任务提交、资源监控、任务调度和执行。" 104622536,5844200,MyBatis批量更新在Oracle、DB2环境下的实现,"['SQL', '数据库', 'MyBatis', 'Oracle', 'DB2']
摘要由CSDN通过智能技术生成

MapReduce:分布式并行编程框架

(一)概述

1.与传统并行计算框架的对比

传统的并行计算框架(如MPI)采用共享式架构(共享内存&存储、采用存储区域网络SAN)、容错性较差;使用的刀片服务器价格高、集群扩展性差(只能从提高机器性能上进行纵向扩展)。它适用于要求实时性、细粒度计算和计算密集型的场景。

MapReduce采用非共享式架构,容错性好;并且它所用的服务器均为普通PC机(价格便宜)、且横向扩展性好(通过增加服务器即可实现集群扩展)。它适用于批处理、非实时、数据密集型的场景。

2.模型简介

MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数:Map和Reduce。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值