自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Hadoop Mapreduce

Hadoop MapReduce 整个MR的过程可以分解为下面几步 读取数据 Map reduce output Hadoop 读取数据 通过InputFormat决定读取的数据的类型,然后拆分成一个个InputSplit,每个InputSplit对应一个Map处理,RecordReader读取InputSplit的内容给Map 通过InputFormat决定读取的数据的类型 功能 验证...

2019-02-24 15:29:27 232

原创 YARN基本原理和YARN工作流程

Mapreduce 1.0 旧的MapReduce架构 旧的MapReduce架构 、 基本概念 JobTracker: 负责资源管理,跟踪资源消耗和可用性,作业生命周期管理(调度作业任务,跟踪进度,为任务提供容错) TaskTracker: 加载或关闭任务,定时报告认为状态 旧的架构的问题 JobTracker是MapReduce的集中处理点,存在单点故障 JobTracker完成了太多的...

2019-02-20 23:30:09 1255

原创 Hadoop-HDFS基本原理

Hadoop (HDFS) Hadoop Distributed File System,分布式文件系统 架构中的基本概念 block 基本存储单位,一般64M,比数据库中的页要大很多 基本的读写单位,类似于磁盘的页,每次都是读写一个块 每个块都会被复制到多台机器,默认复制3份 配置大的block 减少搜寻时间,一般硬盘传输速率比寻道时间要快,大的块可以减少寻道时间 每个块都需要在Name...

2019-02-19 22:38:50 195

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除