- What's Hadoop
一个支持数据密集型分布式系统的软件框架,使用java编程语言。能够支持成千上万个节点和海量数据处理的集群计算。
Hadoop Homepage:http://hadoop.apache.org/
Hadoop 中文资料:http://hadoop.apache.org/common/docs/r0.18.2/cn/index.html
- Linux安装
- 下载hadoop最新的release版本(hadoop-0.21.0)
- 安装jdk,配置好环境变量
- 安装ssh和rsync
- 详细教程见:http://hadoop.apache.org/common/docs/r0.18.2/cn/quickstart.html
- Hadoop Hello Word程序-WordCount
用eclipse将代码打包成jar文件:wordcount.jar。将wordcount.jar拷贝到hadoop的根目录下。
- 结果