什么是hdfs
**1:HDFS文件系统 **
HDFS,是一个文件系统,用于存储文件,通过目录来定位文件;
是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
HDFS的设计适合一次 写入,多次读取的场景,不支持文件的修改。
适合用来做 数据分析,
2:HDFS 组成
HDFS集群包括,NameNode和DataNode以及Secondary Namenode。
NameNode负责管理整个文件系统的元数据,以及每一个路径(文件)所对应的数据块信息。
DataNode 负责管理用户的文件数据块,每一个数据块最多可以在datanode上存储多个副本。
3:HDFS块文件的大小
hadoop2.x默认block块是128M hadoop1.x默认是64M 可以自定义设置块文件大小
4:HDFS命令
hdfs dfs 具体命令
4.1:hdfs dfs –ls 显示HDFS目录的信息
4.2:hdfs dfs –mkdir –p /aa/bb/cc/dd 递归创建目录
4.3:hdfs dfs -cat :显示文件内容
4.6:-text:以字符形式打印一个文件的内容
hdfs dfs -text /aa
4.5:-chgrp 、-chmod、-chown:修改文件所属权限
hdfs dfs -chmod 666 /aa.txt
4.6:-copyFromLocal:从本地文件系统中拷贝文件到hdfs路径去
hdfs dfs -copyFromLocal ./jdk.tar.gz /aaa/
4.7:-copyToLocal:从hdfs拷贝到本地
hdfs dfs -copyToLocal /aa/bb
4.8:-cp :从hdfs的一个路径拷贝到hdfs的另一个路径
hdfs dfs -cp /aa/bb /cc/dd
4.9:-mv:在hdfs目录中移动文件
hdfs dfs -mv /aa/bb
4.