伪分布式搭建

最新推荐文章于 2024-07-28 20:13:01 发布

weixin_30641465

最新推荐文章于 2024-07-28 20:13:01 发布

阅读量86

点赞数

文章标签：运维大数据

原文链接：http://www.cnblogs.com/JBLi/p/10655441.html

版权

安装伪分布式流程

1.关防火墙

2.设置IP地址

3.设置network文件hosts映射文件

4.安装jdk 5.安装hadoop

6.配置hadoop: hadoop-env.sh、core-site.xml、hdfs-site.xml、 Mapred-site.xml、yarn-site.xml



1 修改主机名（永久性： /etc/syscofig/network）

1.1重启网卡（命名行重启）

1.2 机器重启（reboot）

1.3 配置映射 vim/etc/hosts 识别本主机的映射

2 单节点的配置免密：

参考秘钥笔记

ssh -keygen -t rsa （生成私钥）

查看文件夹.ssh （）

ssh -copy-id 192.168.80.1

3 修改 hadoop-env.sh

4 修改 core-site.xml (namenode服务的)

<property>

<name></name>

<value></value>

</property>

4.1 ：namenode 的主机名和端口号：主机名自己的 9000

4.2 hadoop 集群格式化之后形成的（name 写死）（value路径：最好不要写成/root）

5 修改 hdfs-site.xml (副本数量) 3

Mv hah.txt haha1.txt

6 修改mapred-site.xml.template mr---->yarn

7 修改yarn-site.xml （服务于yarn） mr 运行在yarn上

Hdfs:分布式的 nodemanager (namenode) resourceManager(datenode)

一主多从的关系

统计一段时间内淘宝用户的登录：

1 记录（张三，1）（李四，1）（张三，1）（张三，1）（王五，1）（李四，1）.。。。。。。。。。。

2mr :map(k,v)

（张三，（1,1,1））（李四，（1,1））（王五，1）

（张三，3）（李四，2）（王五，1）（shuffle:数据的从新分发）

reduce (合并)

8 集群进行format

Hdfs namenode -format 产生 fsimage edits

转载于:https://www.cnblogs.com/JBLi/p/10655441.html

weixin_30641465

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。