Hadoop学习4-HDFS详解1(SNN、副本放置策略)

最新推荐文章于 2022-07-12 15:38:15 发布

deyu1982

最新推荐文章于 2022-07-12 15:38:15 发布

阅读量801

点赞数

分类专栏： Hadoop学习历程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/deyu1982/article/details/41775685

版权

Hadoop学习历程专栏收录该内容

15 篇文章 0 订阅

订阅专栏

总结上一次学习:

1)搭建hdfs集群可能会出现namenode 、datanode进程会挂掉？

需要查看logs的异常信息在来看

如果namenode没有正常启动，原因可能是没有正确的格式化

如果datanode没有启动，原因可能是namespaceId不一样

正确步骤:

rm -rf 本地hdfs存储目录

执行 ./hadoop namenode -format

执行./start-dfs.sh

2)dfsadmin -setQuota的问题

dfsadmin -setQuota限制文件数量

dfsadmin -setSpaceQuota限制上传文件的磁盘空间

3)小文件的配置？以及如何处理？

hdfs默认的数据库大小是64M，如果文件小于64M可以通过archive的方式来合并文件

数据块大小使用dfs.block.size这个属性来配置

4)start-dfs.sh执行过程中warning信息的说明?

如:Unable to load native-hadoop library for your platform....

usring built-in java class

很多时候可以通过JNI调用c/C++编写的native库，如果没有找到就会使用内置的java code

5) 重复运行wordcount.java会存在提示目录已经存在

可以先删除，直接删除目录或者用hadoop fs -rm 删除

可以在程序中判断，如果存在先删除在提交

可以修改源代码增加目录替换功能

6)默认的hadoop conf路径变成了etc/hadoop

在启动start-dfs.sh时会先去source hadoop-config.sh

然后会去找conf/hadoop-env.sh

如果不存在就会设施成etc/hadoop

存在就会去执行 hadoop-daemon.sh或者hadoop-daemons.sh

然后去找到相应的java程序执行

打开eclipse新建一个项目

导入hadoop1.2.1源代码，先导入core然后导入hdfs

配置相应的依赖包

如果出现

sun.net.util.IPAddressUtil错误时

解决了，sun.net包里的类，在eclipse里默认是不让用的。解决办法是自定义access rules
工程上右键->工程属性->java builder path->Libraries标签，点击JRE System Library里面的Access rules，add sun/** 为accessible，如果该项存在，就edit。

HDFS优缺点:

SecondNameNode

1)不是Namenode的备份

2)周期性合并fsimagehe editslog,并推送给namenode

editslog是所有操作记录

fsimage是namenode的一个镜像

3)辅助恢复Namenode

4)SecondaryNameNode的作用现在可以被两个节点替换，checkpoint node 与backup node

2.0时代已经被checkpoint node替代 backup node是namenode的完全备份

通过配置conf/core-site.xml文件配置checkpoint

jps查看一下是否已经启动dfs如果启动./stop-dfs.sh停掉

然后./hadoop namenode -format

然后重新启动./start-dfs.sh

然后等待30秒，查看/tmp/hadoop/secondarynamenode目录

多出两个目录，查看cat current/VERSION

Checkpoint Node 和Scondary NameNodede 作用完全相同

但是在1.x版本是不存在checkpoint Node命令的

启动命令是 bin/hdfs namenode -checkpoint

Backup Node

是真正意义上的备用节点

在内存中维护一份从namenode同步过来的fsimage，同时它还从namenode接受edits文件的日志流

并把它们持久化磁盘

Backup Node在内存中维护和NameNode一样的Matadata数据

启动命令用bin/hdfs namenode -backup

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop学习4-HDFS详解1(SNN、副本放置策略)

总结上一次学习:1)搭建hdfs集群可能会出现namenode 、datanode进程会挂掉？需要查看logs的异常信息在来看如果namenode没有正常启动，原因可能是没有正确的格式化如果datanode没有启动，原因可能是namespaceId不一样正确步骤:rm -rf 本地hdfs存储目录执行 ./hadoop namenode -format执行./sta
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。