试了一下在ubuntu下搭一个伪分布式的hadoop环境,主要是参考的这篇文章http://blog.csdn.net/hitwengqi/article/details/8008203
碰到了一些问题,主要是在格式化namenode 时总是不成功。查了一下网上的资料,发现原因是:http://blog.sina.com.cn/s/blog_48a45b9501011z7d.html
在对namenode格式化之前,要确保dfs.name.dir参数指定的目录不存在。
Hadoop这样做的目的是防止错误地将已存在的集群格式化了
把hdfs下的两个子目录删掉后就格式化成功了。后面基本上没有问题了。另外,一开始安装ssh老是报错,更新源之后就好了。