【Hadoop】搭建完全分布式的hadoop

最新推荐文章于 2024-07-03 11:33:10 发布

置顶大牛笔记

最新推荐文章于 2024-07-03 11:33:10 发布

阅读量8.3k

点赞数 3

分类专栏： BigData

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixuehao/article/details/15813681

版权

BigData 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

用于测试，我用4台虚拟机搭建成了hadoop结构

我用了两个台式机。一个xp系统，一个win7系统。每台电脑装两个虚拟机，要不然内存就满了。

1、安装虚拟机环境

Vmware，收费产品，占内存较大。

或

Oracle的VirtualBox，开源产品，占内存较小，但安装ubuntu过程中，重启会出错。

我选Vmware。

2、安装操作系统

Centos，红帽开源版，接近于生产环境。

Ubuntu，操作简单，方便，界面友好。

我选Ubuntu12.10.X 32位

3、安装一些常用的软件

在每台linux虚拟机上，安装：vim，ssh

sudo apt-get install vim

sudo apt-get install ssh

在客户端，也就是win7上，安装SecureCRT，Winscp或putty，这几个程序，都是依靠ssh服务来操作的，所以前提必须安装ssh服务。

service ssh status 查看ssh状态。如果关闭使用service ssh start开启服务。

SecureCRT，可以通过ssh远程访问linux虚拟机。

winSCP或putty，可以从win7向linux上传文件。

4、修改主机名和网络配置

主机名分别为：master，host2，host3，host4。

sudo vim /etc/hostname

网络配置，包括ip地址，子网掩码，DNS服务器。如上图所示。

5、修改/etc/hosts文件。

修改每台电脑的hosts文件。

hosts文件和windows上的功能是一样的。存储主机名和ip地址的映射。

在每台linux上，sudo vim /etc/hosts 编写hosts文件。将主机名和ip地址的映射填写进去。编辑完后，结果如下：

6、配置ssh，实现无密码登陆

无密码登陆，效果也就是在master上，通过 ssh host2 或 ssh host3 或 ssh host4 就可以登陆到对方计算机上。而且不用输入密码。

四台虚拟机上，使用 ssh-keygen -t rsa 一路按回车就行了。

刚才都作甚了呢？主要是设置ssh的密钥和密钥的存放路径。路径为~/.ssh下。

打开~/.ssh 下面有三个文件

authorized_keys，已认证的keys

id_rsa，私钥

id_rsa.pub，公钥三个文件。

下面就是关键的地方了，（我们要做ssh认证。进行下面操作前，可以先搜关于认证和加密区别以及各自的过程。）

①在master上将公钥放到authorized_keys里。命令：sudo cat id_rsa.pub >> authorized_keys

②将master上的authorized_keys放到其他linux的~/.ssh目录下。

命令：sudo scp authorized_keys hadoop@10.10.11.192:~/.ssh

sudo scp authorized_keys 远程主机用户名@远程主机名或ip:存放路径。

③修改authorized_keys权限，命令：chmod 644 authorized_keys

④测试是否成功

ssh host2 输入用户名密码，然后退出，再次ssh host2不用密码，直接进入系统。这就表示成功了。

7、上传jdk，并配置环境变量。

通过winSCP将文件上传到linux中。将文件放到/usr/lib/java中，四个linux都要操作。

解压缩：tar -zxvf jdk1.7.0_21.tar

设置环境变量 sudo vim ~/.bashrc

在最下面添加：

export JAVA_HOME = /usr/lib/java/jdk1.7.0_21

export PATH = $JAVA_HOME/bin:$PATH

修改完后，用source ~/.bashrc让配置文件生效。

8、上传hadoop，配置hadoop

通过winSCP，上传hadoop，到/usr/local/下，解压缩tar -zxvf hadoop1.2.1.tar

再重命名一下，sudo rm hadoop1.2.1 hadoop

这样目录就变成/usr/local/hadoop

①修改环境变量，将hadoop加进去（最后四个linux都操作一次）

sudo vim ~/.bashrc

export HADOOP_HOME = /usr/local/hadoop

export PATH = $JAVA_HOme/bin:$HADOOP_HOME/bin:$PATH

修改完后，用source ~/.bashrc让配置文件生效。

②修改/usr/local/hadoop/conf下配置文件

hadoop-env.sh，

core-site.xml，

hdfs-site.xml，

mapred-site.xml，

master，

slave，

上面的hadoop-env.sh，core-site.xml，mapred-site.xml，hdfs-site.xml，master，slave几个文件，在四台linux中都是一样的。

配置完一台电脑后，可以将hadoop包，直接拷贝到其他电脑上。

③最后要记得，将hadoop的用户加进去，命令为

sudo chown -R hadoop@hadoop hadoop

sudo chown -R 用户名@用户组目录名

④让hadoop配置生效

source hadoop-env.sh

⑤格式化namenode，只格式一次

hadoop namenode -format

⑥启动hadoop

切到/usr/local/hadoop/bin目录下，执行 start-all.sh启动所有程序

⑦查看进程，是否启动

jps

master，

host2，

host3，host4，的显示结果，与host2相同。

点击此处-去我的博客园 http://www.cnblogs.com/laov/p/3421479.html

关注

3
点赞
踩
20

收藏

觉得还不错? 一键收藏
7
评论
【Hadoop】搭建完全分布式的hadoop

用于测试，我用4台虚拟机搭建成了hadoop结构我用了两个台式机。一个xp系统，一个win7系统。每台电脑装两个虚拟机，要不然内存就满了。 1、安装虚拟机环境 Vmware，收费产品，占内存较大。或 Oracle的VirtualBox，开源产品，占内存较小，但安装ubuntu过程中，重启会出错。我选Vmware。2、安装操作系
复制链接

扫一扫

专栏目录

大牛笔记 CSDN认证博客专家 CSDN认证企业博客

码龄15年

16: 原创

24万+: 周排名

221万+: 总排名

6万+: 访问

: 等级

903: 积分

40: 粉丝

20: 获赞

18: 评论

11: 收藏

私信

关注

热门文章

分类专栏

Web 1篇
Java 2篇
DotNet 2篇
BigData 10篇
DataBase 1篇
ProjectManage 1篇

最新评论

查询MYSQL和查询HBASE速度比较
泪三国云无痕: 博主后面有什么提高写入速度的措施吗?
【Hadoop】用web查看hadoop运行状态
落叶子: [url=http://www.itxm.net/a/dashuju/2016/0610/279.html]程序员必须要知道的Hadoop的一些事实[/url]
【Hadoop】搭建完全分布式的hadoop
落叶子: [url=http://www.itxm.net/a/dashuju/2016/0610/279.html]程序员必须要知道的Hadoop的一些事实[/url]
【Hadoop】HDFS的运行原理
初涉大数据的小白: 博主，你好！按照你对流式写入的描述，我的理解是，Block1被分成若干份，每份都先后结果客户端、host2、host1，最后到了host3。这个过程中没有复制的动作发生。但是你有一句是“”通过写过程，我们可以了解到：写1T文件，我们需要3T的存储。”我实在没看出流式传递和这个3:1的存储比例有什么关系。
【Hadoop】HDFS的运行原理
初涉大数据的小白: 博主，你好！按照你对流式写入的描述，我的理解是，Block1被分成若干份，每份都先后结果客户端、host2、host1，最后到了host3。这个过程中没有复制的动作发生。但是你有一句是“”通过写过程，我们可以了解到：写1T文件，我们需要3T的存储。”我是在没看出流式传递和这个3:1的存储比例有什么关系。

大家在看

最新文章

目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。