首页
-
hadoop一个用于在普通硬件构成 的大集群上运行应用程序的框架。Hadoop框架透明地为应用程序提供可靠性与数据移动保障。Hadoop实现了一个被称为 mapReduce的 计算模型,在这个计算模型中应用程序被分为很多的小块,每一块都能在集群中的任意节点上执行或重新执行。另外,它还提供了一个分布式文件系统(HDFS)来在计算节 点上存储数据,为集群提供了非常高的聚合带宽。在本框架中无论是Map/Reduce还是分布式文件系统都被设计为能够自动地处理节点上的错误
-
Overview of Hadoop
-
Official Hadoop Core Website : download, bug-tracking, mailing-lists, etc.
-
PoweredBy, 谁在使用Hadoop
- 获取帮助
-
Hadoop用户组 (HUGs)
用户文档
-
在Ubuntu Linux (单节点集群)上运行hadoop(一个关于Hadoop安装,配置以及在单节点上运行的指南)
-
GangliaMetrics:怎样在ganglia里面加入计量
- Map/Reduce
- Examples
- Amazon
- 标准测试集
- 子项目
- 贡献包
-
HadoopStreaming (对于使用其他编程语言来编写Hadoop应用程序非常有用)
-
DistributedLucene, 对于在Hadoop上使用分布式Lucene 索引的一个建议
-
MountableHDFS, Fuse-DFS &其他工具用于把HDFS当作一个标准的文件系统mount到Linux上 (以及其他Unix OSs)
-
HDFS-APIs 使用 perl, python, php, 等等
-
Chukwa:一个数据收集,存储,与分析的框架
-
开发者文档
-
Jira 用法指导
相关资源
-
Nutch Hadoop指南:对于在一个应用上下文环境下理解Hadoop非常有用
-
IBM MapReduce Tools for Eclipse:一个简化了fMapReduce 程序创建于部署的Eclipse插件
- Hadoop IRC channel 是#hadoop at irc.freenode.net.
-
Using Spring and Hadoop (讨论共同使用Hadoop与Spring提供的的依赖注入特性的可能性)
-
Hama, 一个基于Hadoop Map/Reduce 的并行矩阵计算包
-
Heart, 一个全球大小的RDF数据存书与分布式处理引擎
-
Mahout, 使用Hadoop的高可扩展的机器学习算法scalable Machine Learning algorithms using Hadoop
-
Live Hadoop 一个三个节点的,运行着 OpenSolaris live 系统的分布式Hadoop集群