自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

陈先生-HDU的博客

hadoop初学者

  • 博客(4)
  • 收藏
  • 关注

原创 MR源码学习(三)

job.setOutputFormatClass(TextOutputFormat.class);学习MR的输出过程,依然是从上面的代码作为入口,默认的输出格式是TextOutputFormat类。先不看TextOutputFormat类,看他最顶级的父类OutputFormat/** * OutputFormat describes the output-specification for

2015-12-14 16:12:05 443

原创 HDFS(3)

1.继续研究HDFS写操作的源码过程,客户端通过DistributedFileststem中的create方法创建文件。结构与上一篇读文件的操作类似,会执行FileSystemLinkResolver的resolve方法,即调用docall方法。public FSDataOutputStream doCall(final Path p) throws IOException

2015-12-10 16:07:14 386

原创 HDFS(2)

HDFS中读文件过程,如上图所示。1.打开一个分布式文件系统,也就是API中的filesystem.get()方法,获得一个文件系统实例。2.通过fs的open方法,fs会通过RPC来调用nn,通过方法传入的文件名称,会在nn中得到blocksequence中的一批block信息。3.

2015-12-08 19:06:29 392

原创 HDFS(1)

HDFS中,主要有namenode与datanode节点。其中,namenode节点主要保存数据的元数据信息,datanode保存数据本身。对于 namenode而言,hdfs中只有一个namenode节点,所以namenode至关重要,也就有了namenode的HA研究。nn中具体保存fsimage和edits两种文件,文件位置在hdfs-site.xml中dfs.namenode.name.d

2015-12-07 14:34:21 262

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除