hadoop1.2.1伪分布式安装

最新推荐文章于 2018-06-15 08:42:58 发布

赶路人儿

最新推荐文章于 2018-06-15 08:42:58 发布

阅读量991

点赞数 1

分类专栏： hadoop 文章标签： hadoop hadoop安装

本文链接：https://blog.csdn.net/liuxiao723846/article/details/45014743

版权

hadoop 专栏收录该内容

58 篇文章 0 订阅

订阅专栏

1、安装虚拟机、OS环境：

1）安装virtualbox虚拟机，配置网络

2）安装centos系统

3）安装jdk，配置环境变量

4）ssh互信：

1>ssh-keygen -t rsa在~/.ssh目录下产生了秘钥id_rsa.pub

2>复制秘钥给对方(自己)作为公钥：cp id_rsa.pubauthorized_keys

3>验证 ssh localhost

2、修改linux配置：

1）配置静态ip：

service network restart

2）修改主机名：

1>修改当前回话主机名(仅仅当前回话有效)：hostname hadoop

2>修改配置文件中的主机名(永久有效)：vim/etc/sysconfig/network

3>查看主机名：hostname

3）把hostname和ip绑定：

执行命令 vim /etc/hosts,增加一行内容：192.168.100.123hadoop

验证：ping hadoop

4）关闭防火墙：

执行命令：service iptables stop

查看状态：service iptables status

5）关闭防火前开机自启动：

chkconfig --list | grep iptables

执行命令：chkconfig iptables off

3、hadoop伪分布式安装：

1）下载hadoop1.2.1.tar.gz（下载地址：http://ftp.yz.yamagata-u.ac.jp/pub/network/apache/hadoop/common/）；直接解压.tar.gz包即可；然后设置hadoop的环境变量：

tar -xvzfhadoop1.2.1.tar.gz

export HADOOP_HOME=/usr/local/hadooop

exportPATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH

source /etc/profile

2）伪分布式安装(默认hadoop是本地模式)

修改$HADOOP_HOME/conf目录下的 hadoop-env.sh、core-site.xml、 hdfs-site.xml 、mapred-site.xml

1>在hadoop-env.sh中把JAVA_HOME这一行的注释删掉，然后修改正确的java_home位置(大约在第9行)

2> 在core-site.xml中添加如下：

<name>fs.default.name</name>

<value>hdfs://hadoop:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/tmp</value>

</property>

<!—hadoop.tmp.dir 是hadoop文件系统依赖的基础配置，很多路径都依赖它。如果hdfs-site.xml中不配置namenode和datanode的存放位置，默认就放在这个路径中-->

3> hdfs-site.xml中增加如下：

<name>dfs.replication</name>

</property>

</property>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

<!—解决：org.apache.hadoop.security.AccessControlException:Permission denied:user=Administrator,access=WRITE,inode="tmp":root:supergroup:rwxr-xr-x。因为Eclipse使用hadoop插件提交作业时，会默认以 DrWho 身份去将作业写入hdfs文件系统中，对应的也就是 HDFS 上的/user/hadoop, 由于 DrWho 用户对hadoop目录并没有写入权限，所以导致异常的发生。解决方法为：放开 hadoop 目录的权限，命令如下：$ hadoop fs -chmod 777 /user/hadoop-->

4>mapred.xml中增加：

<name>mapred.job.tracker</name>

<value>hadoop:9001</value>

</property>

3）对hadoop的hdfs进行格式化：

hadoop namenode –format

4）启动hadoop：

进入hadoop目录,在bin/下面有很多启动脚本，可以根据自己的需要来启动。

* start-all.sh 启动所有的Hadoop守护。包括namenode,datanode, jobtracker, tasktrack

* stop-all.sh 停止所有的Hadoop

* start-mapred.sh启动Map/Reduce守护。包括Jobtracker和Tasktrack