以hadoop1.2.1为例
一、安装jdk
二、安装hadoop
1、解压到/usr/local/hadoop
2.配置文件
(1)伪分布式
a. hadoop-env.sh
配置JAVA_PATH:export JAVA_PATH = /usr/local/hadoop/
b.hdfs-site.xml
<
configuration
>
<
name
>dfs.data.dir</
name
>
<
value
>/usr/local/hadoop-1.2.1/data</
value
>
</
property
>
<
property
>
<
name
>dfs.replication</
name
>
<
value
>1</
value
>
</
property
>
</
configuration
>
dfs.data.dir:数据节点存储块的目录列表。
dfs.replication:数据块备份的份数。
|
c.mapred-core.xml
<
configuration
>
<
property
>
<
name
>mapred.job.tracker</
name
>
<
value
>localhost:9001</
value
>
</
property
>
</
configuration
>
mapred.job.tracker:作业跟踪器的位置
|
d.core-site.xml
<
configuration
>
<
property
>
<
name
>fs.default.name</
name
>
<
value
>hdfs://localhost:9000</
value
>
</
property
>
</
configuration
>
fs.default.name NameNode的IP地址和端口
|
(2)单机模式
(3)完全分布式模式
三、配置SSH客户端不需要输入密码登陆 cd ~
生成公私钥对:ssh-keygen -t rsa
公钥-./ssh/id_rsa.pub
私钥-./ssh/id_rsa
用其中一个加密,用另一个解密
将公钥加到authorized_keys中:
cp id_rsa.pub authorized_keys
以后有用户用公钥远程登陆系统,如果authorized_keys中记录了该公钥,则该用户可以免密码登陆。
四、格式化hdfs
bin/hadoop namenode -format
五、启动/关闭hadoop
bin/start-all.sh
bin/stop-all.sh
六、通过浏览器来查看hadoop的命名节点(NameNode)和作业追踪器(JobTracker)
NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/