namenode和datanode工作机制_Hadoop的namenode的管理机制，工作机制和datanode的工作原理...

最新推荐文章于 2024-01-04 21:25:53 发布

weixin_39980893

最新推荐文章于 2024-01-04 21:25:53 发布

阅读量690

点赞数

文章标签： namenode和datanode工作机制

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39980893/article/details/111538254

版权

HDFS前言：

1) 设计思想

分而治之：将大文件、大批量文件，分布式存放在大量服务器上，以便于采取分而治之的方式对海量数据进行运算分析；

2)在大数据系统中作用：

为各类分布式运算框架(如：mapreduce，spark，tez，……)提供数据存储服务

3)重点概念：文件切块，副本存放，元数据

4)、NameNode节点：由core-site.xml配置指定(name=fs.defaultFS,value=hdfs://slaver1:8020)。

DataNode/NodeManager节点：由slavers文件指定。

SecondaryNameNode节点：由hdfs-site.xml文件指定(name=dfs.namenode.secondary.http-address,value=slaver1:50090)

ResourceManager节点：在yarn-site.xml文件中指定(name=yarn.resourcemanager.hostname,value=slaver1)。

historyServer节点：在mapred-site.xml配置文件里面修改。

1：分布式文件系统(Distributed File System)：

(1)：数据量越来越多，在一个操作系统管辖的范围存不下了，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，因此迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。

(2)：是一种允许文件通过网络在多台主机上分享的文件系统，可让多机器上的多用户分享文件和存储空间。

(3)：通透性。让实际上是通过网络来访问文件的动作，由程序与用户看来，就像是访问本地的磁盘一般。

(4)：容错。即使系统中有某些节点脱机，整体来说系统仍然可以持续运作而不会有数据损失。

(5)：分布式文件管理系统很多，hdfs只是其中一种。适用于一次写入多次查询的情况，不支持并发写情况，小文件不合适。

2：Hadoop最擅长的是(离线 )日志分析

(1)：HDFS----》海量数据的存储，负责文件读写。

(2)：MapReduce----》海量数据的分析。

(3)：YARN----》资源管理调度，负责为mapreduce程序分配硬件资源。

3：HDFS的Shell

(1)：调用文件系统(FS)Shell命令应使用 bin/hadoop fs 的形式。

(2)：所有的FS shell命令使用URI路径作为参数。

URI格式是scheme://authority/path。HDFS的scheme是hdfs，对本地文件系统，scheme是file。其中scheme和authority参数都是可选的，如果未加指定，就会使用配置中指定的默认scheme。

例如：/parent/child可以表示成hdfs://namenode:namenodePort/parent/child，或者更简单的/parent/child(假设配置文件是namenode:namenodePort)

(3)：大多数FS Shell命令的行为和对应的Unix Shell命令类似。

4：HDFS fs命令

(1)-help [cmd] //显示命令的帮助信息

(2)-ls(r) //显示当前目录下所有文件

(3)-du(s) //显示目录中所有文件大小

(4)-count[-q] //显示目录中文件数量

(5)-mv //移动多个文件到目标目录

(6)-cp //复制多个文件到目标目录

(7)-rm(r) //删除文件(夹)

(8)-put //本地文件复制到hdfs

(9)-copyFromLocal //同put

(10)-moveFromLocal //从本地文件移动到hdfs

(11)-get [-ignoreCrc] //复制文件到本地，可以忽略crc校验

(12)-getmerge //将源目录中的所有文件排序合并到一个文件中

(13)-cat //在终端显示文件内容

(14)-text //在终端显示文件内容

(15)-copyToLocal [-ignoreCrc] //复制到本地

(16)-moveToLocal

(17)-mkdir //创建文件夹

(18)-touchz //创建一个空文件

5：HDFS的Shell命令练习

(1)#hadoop fs -ls / 查看HDFS根目录

(2)#hadoop fs -mkdir /test 在根目录创建一个目录test

(3)#hadoop fs -mkdir /test1 在根目录创建一个目录test1

(4)#hadoop fs -put ./test.txt /test或#hadoop fs -copyFromLocal ./test.txt /test

(5)#hadoop fs -

最低0.47元/天解锁文章

weixin_39980893

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
namenode和datanode工作机制_Hadoop的namenode的管理机制，工作机制和datanode的工作原理...

HDFS前言：1) 设计思想分而治之：将大文件、大批量文件，分布式存放在大量服务器上，以便于采取分而治之的方式对海量数据进行运算分析；2)在大数据系统中作用：为各类分布式运算框架(如：mapreduce，spark，tez，……)提供数据存储服务3)重点概念：文件切块，副本存放，元数据4)、NameNode节点：由core-site.xml配置指定(name=fs.defaultFS,value=...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。