- 博客(4)
- 资源 (8)
- 收藏
- 关注
原创 Hadoop之HDFS子框架
体系结构由图片可以看到HDFS主要包含这样几个功能组件Namenode:存储文档的元数据信息,还有整个文件系统的目录结构DataNode:存储文档块信息,并且文档块之间是有冗余备份的这里面提到了文档块的概念,同本地文件系统一样,HDFS也是按块存储的,只不过块的大小设置的相对大一些,默认为64M。如果一个文件不足64M,那么它只存储在一个块中,而且并不会占用64M的磁盘空间,
2013-02-19 15:51:17 5149
原创 hadoop的产生
大数据的概念最早是由麦肯锡这家公司提出的,他们指出:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”进入2012年,大数据的概念开始被越来越多的提及,甚至已经上了纽约时报和华尔街日报的专栏封面。随着系统信息化的建设,海量数据正呈现井喷式增长,如何消化和分析这些数据从中提炼出有价值的信息是企业所要面
2013-02-19 12:27:12 3227
原创 MapReduce执行流程
MapReduce的大体流程是这样的,如图所示:由图片可以看到mapreduce执行下来主要包含这样几个步骤1.首先对输入数据源进行切片2.master调度worker执行map任务3.worker读取输入源片段4.worker执行map任务,将任务输出保存在本地5.master调度worker执行reduce任务,reduce worker读取map任务的输出文件
2013-02-07 18:17:27 23690 2
原创 hadoop counter
hadoop计数器的主要价值在于可以让开发人员以全局的视角来审查程序的运行情况,及时做出错误诊断并进行相应处理hadoop内置了很多计数器,这些计数器大体上可分为三组,MapReduce相关、文件系统相关和作业调度相关,分别统计每一个环节的处理情况,计数详情可通过http://master:50030/jobdetails.jsp界面进行查看除了内置计数器,hadoop还提供自定义计数
2013-02-04 15:35:10 8271
saxon的jar包
2013-03-04
TFS JavaAPI源码(附带JUinit测试用例)
2012-08-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人