HDFS_05_元数据
持续更新大数据
文章…
1. 一个文件包含的内容
我们现在学的是 HDFS,HDFS是用来储存文件的,那么我们有必要了解一个文件包含了哪些内容
一个文件内容可以大体分为两个部分:元数据、真实数据。
1.1 元数据
元数据是用来描述文件基本信息的数据,比如:
- 文件大小
- 文件用户-组-权限
- 文件创建时间等…
如果是这个文件要上传到 HDFS,那么元数据至少要包含:
-
文件对应的数据块信息
-
文件的数据块副本数量
-
文件大小
-
文件用户-组-权限
-
文件创建时间等…
补充说明一下:
- 一个文件中的块大小必须相同,除了最后一个块的大小
- 数据块大小一旦被确定就不能被修改,数据块默认大小是 128MB
- 文件对应的数据块副本数可以被修改,但是一般副本数为3个
1.2 真实数据
文件真正存放的内容,这个数据就是存储在硬盘上的二进制数据。
下期讲解 HDFS_06_HDFS服务器节点的分类......