hadoop
文章平均质量分 81
码农SW
这个作者很懒,什么都没留下…
展开
-
hadoop-mapReduce工作流程和组件简介
1. 概述 1970年,IBM的研究员E.F.Codd博士在刊物《Communication of the ACM》上发表了一篇名为“A Relational Model of Data for Large Shared Data Banks”的论文,提出了关系模型的概念,标志着关系数据库的诞生,随后几十年,关系数据库及其结构化查询语言SQL成为程序员必须掌握的基本技能之一。 2005转载 2012-07-23 17:44:45 · 2193 阅读 · 0 评论 -
mapreduce-wordcount例子
原版: http://hadoop.apache.org/common/docs/r0.20.2/mapred_tutorial.html#Job+Output 中文版: http://blog.csdn.net/ant_yan/article/details/7366391原创 2012-07-23 18:05:20 · 691 阅读 · 0 评论 -
Hadoop-MapReduce-TeraSort-大数据排序例子
1TB(或1分钟)排序的冠军 作为分布式数据处理的框架,集群的数据处理能力究竟有多快?或许1TB排序可以作为衡量的标准之一。 1TB排序,就是对1TB(1024GB,大约100亿行数据)的数据进行排序。2008年,Hadoop赢得1TB排序基准评估第一名,排序1TB数据耗时209秒。后来,1TB排序被1分钟排序所取代,1分钟排序指的是在一分钟内尽可能多的排序。2009年,在一个1406转载 2012-07-24 17:37:43 · 8955 阅读 · 1 评论