linux操作系统:文件系统,归档档案库

引入

  • 会议室管理系统(内存管理)的作用是确保多个项目执行的时候,隔离性可以得到保证。
  • 但是,会议室里面保存的资料是暂时的,一旦项目结束,会议室会被回收,会议室里面的资料就丢失了。
  • 有一些资料我们希望项目结束之后也能继续保存,这就需要一个和项目运行生命周期无关的地方,可以永久保存,并且空间也会比会议室大的多。 在操作系统中对应的就是文件系统

那我们应该如何组织规划文件系统这个档案库呢?

文件系统的功能规划

对于运行的进程来说,内存就像一个纸箱子,仅仅是一个暂存数据的地方,而且空间有限。如果我们想要进程结束之后,数据依然能够保存下来,就不能只保存在内存里,而是应该保存在外部存储中。就像图书馆这种地方,不仅空间大,而且能够永久保存。

我们最常用的外部存储就是硬盘,数据是以文件的形式保存在硬盘上的。为了管理这些文件,我们在规划文件系统的时候,需要考虑如下几点。

  • 第一点:文件系统要有严格的组织形式,使得文件能够以块为单位进行存储
    • 这就像图书馆里,我们会给设置一排排书架,然后再把书架分成一个个小格子
    • 有的项目存放的资料非常多,一个格子放不下,就需要多个格子来进行存放
    • 我们把这个区域称为原始资料的仓库区
  • 第二点:文件系统中也要有索引区,用来方便查找一个文件分成的多个块都存放在了什么位置
    • 这就好比,图书馆的书太多了,为了方便查找,我们需要专门设备一排书架,这里面会写清楚整个档案库有哪些资料,资料在哪个架子的哪个格子上。
    • 这样找资料的时候就不用跑遍整个档案库,在这个书架上找到后,直奔目标书架就可以了
      在这里插入图片描述
  • 第三点,如果文件系统中有的文件是热点文件,近期经常被读取或者写入,文件系统应该有缓存层
    • 这就相当于图书馆里面的热门图书区,这里面的书都是畅销书或者是常常被借还的图书。
    • 因为借还的次数比较多,那就没必要每次有人还了之后,还放回遥远的货架,我们可以专门开辟一个区域,放置这些借还频次高的图书。这样借还的效率就会提高。
  • 第四点,文件应该用文件夹的方式组织起来,方便查询和管理
    • 这就像在图书馆里面,你可以给这些资料分门别类,比如分成计算机类、文学类、历史类等等。这样你也容易管理,项目组借阅的时候只要在某个类别中去找就可以了。
    • 在文件系统中,每个文件都有一个名字,这样我们访问一个文件,希望通过它的名字就可以找到。文件名就是一个普通的文本。当然文件名会经常冲突,不同用户取相同的名字的情况还是会经常出现的。
    • 要想把很多的文件有序地组织起来,我们就需要把它们成为目录或者文件夹。这样,一个文件夹里可以包含文件夹,也可以包含文件,这样就形成了一种树形结构。而我们可以将不同的用户放在不同的用户目录下,就可以一定程度上避免了命名的冲突问题。
    • 有了目录结构,定位一个文件的时候,我们还会分绝对路径(Absolute Path)和相对路径(Relative Path)。所谓绝对路径,就是从根目录开始一直到当前的文件,例如“/ 根目录 / 用户 A 目录 / 目录 1/ 文件 2”就是一个绝对路径。而通过 cd 命令可以改变当前路径,例如“cd / 根目录 / 用户 A 目录”,就是将用户 A 目录设置为当前目录,而刚才那个文件的相对路径就变成了“./ 目录 1/ 文件 2”。

在这里插入图片描述

  • 第五点,linux内核要在自己的内存中里面维护一套数据结构,来保存哪些文件被哪些进程打开和使用
    • 这就好比,图书馆里会有个图书管理系统,记录哪些书被借阅了,被谁借阅了,借阅了多久,什么时候归还。

文件系统相关命令行

格式化

所谓格式化,就是将一块盘使用命令组织成一定格式的文件系统的过程。比如硬盘或者U盘,要先格式化才能放放文件

使用 Windows 的时候,咱们常格式化的格式为NTFS(New Technology File System)。在 Linux 下面,常用的是 ext3 或者 ext4。

当一个 Linux 系统插入了一块没有格式化的硬盘的时候,我们可以通过命令fdisk -l,查看格式化和没有格式化的分区。

# fdisk -l
 
 
Disk /dev/vda: 21.5 GB, 21474836480 bytes, 41943040 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk label type: dos
Disk identifier: 0x000a4c75
 
 
   Device Boot      Start         End      Blocks   Id  System
/dev/vda1   *        2048    41943006    20970479+  83  Linux
 
 
Disk /dev/vdc: 107.4 GB, 107374182400 bytes, 209715200 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes

例如,从上面的命令的输出结果可以看出,vda 这块盘大小 21.5G,是格式化了的,有一个分区 /dev/vda1。vdc 这块盘大小 107.4G,是没有格式化的。

我们可以通过命令mkfs.ext3或者mkfs.ext4进行格式化。

mkfs.ext4 /dev/vdc

执行完这个命令后,vdc会建立一个分区,格式化为ext4文件系统的格式。

当然,你也可以选择不将整块盘格式化为一个分区,而是格式化为多个分区,比如下面这个命令可以启动一个交互式程序

fdisk /dev/vdc

在这个交互式程序中,你可以输入p来打印当前分了几个区。如果没有分过,那这个列表应该是空的。

接下来,你可以输入n新建一个分区。它会让你选择创建主分区 primary,还是扩展分区 extended。我们一般都会选择主分区 p。

接下来,它会让你输入分区号。如果原来没有分过区,应该从 1 开始。或者你直接回车,使用默认值也行。

接下来,你可以一路选择默认值,直到让你指定这个分区的大小,通过 +sizeM 或者 +sizeK 的方式,默认值是整块盘都用上。你可以 输入 +5620M 分配一个 5G 的分区。这个时候再输入 p,就能看到新创建的分区了,最后输入 w,将对分区的修改写入硬盘。

分区结束之后,可能会出现 vdc1, vdc2 等多个分区,这个时候你可以 mkfs.ext3 /dev/vdc1 将第一个分区格式化为 ext3,通过 mkfs.ext4 /dev/vdc2 将第二个分区格式化为 ext4.

格式化后的硬盘,需要挂在某个目录下面,才能作为普通的文件系统进行访问

mount /dev/vdc1  /根目录/用户A目录/目录1
  • 例如,上面这个命令就是将这个文件系统挂在到“/根目录/用户A目录/目录1”这个目录下面。
  • 一旦挂载过去,“/根目录/用户A目录/目录1”这个目录下面原来的文件 1 和文件 2 就都看不到了,换成了 vdc1 这个硬盘里面的文件系统的根目录。

有挂载就有卸载,卸载使用umount命令。

umount /根目录/用户A目录/目录1

查看文件格式

Linux 里面一切都是文件,那从哪里看出是什么文件呢?要从 ls -l 的结果的第一位标识位看出来。

  • - 表示普通文件;
  • d 表示文件夹;
  • c 表示字符设备文件
  • b 表示块设备文件
  • s 表示套接字 socket 文件
  • l 表示符号链接,也即软链接,就是通过名字指向另外一个文件,例如下面,instance 这个文件就是指向了 /var/lib/cloud/instances 这个文件
# ls -l
lrwxrwxrwx 1 root root   61 Dec 14 19:53 instance -> /var/lib/cloud/instances

文件系统相关系统调用

如何使用系统调用在操作文件呢?我们先来看一个完整的例子。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
 
 
int main(int argc, char *argv[])
{
 
 
  int fd = -1;
  int ret = 1;
  int buffer = 1024;
  int num = 0;
 
 
  if((fd=open("./test", O_RDWR|O_CREAT|O_TRUNC))==-1)
  {
    printf("Open Error\n");
    exit(1);
  }
 
 
  ret = write(fd, &buffer, sizeof(int));
  if( ret < 0)
  {
    printf("write Error\n");
    exit(1);
  }
  printf("write %d byte(s)\n",ret);
 
 
  lseek(fd, 0L, SEEK_SET);
  ret= read(fd, &num, sizeof(int));
  if(ret==-1)
  {
    printf("read Error\n");
    exit(1);
  }
  printf("read %d byte(s),the number is %d\n", ret, num);
 
 
  close(fd);
 
 
  return 0;
}
  • 当使用系统调用open打开一个文件时,操作系统会创建一些数据结构来表示这个被打开的文件。为了能够找到这些数据结构,在进程中,我们会为这个打开的文件分配一个文件描述符fd
  • 文件描述符,就是用来区分一个进程打开的多个文件的。它的作用域就是当前进程,出了当前进程这个文件描述符就没有意义了。open返回的fd必须记录好,我们对这个文件的所有操作都要靠这个fd,包含最后关闭文件
  • 接下来,write 要用于写入数据。第一个参数就是文件描述符,第二个参数表示要写入的数据存放位置,第三个参数表示希望写入的字节数,返回值表示成功写入到文件的字节数。
  • lseek 用于重新定位读写的位置,第一个参数是文件描述符,第二个参数是重新定位的位置,第三个参数是 SEEK_SET,表示起始位置为文件头,第二个参数和第三个参数合起来表示将读写位置设置为从文件头开始 0 的位置,也即从头开始读写。
  • read 用于读取数据,第一个参数是文件描述符,第二个参数是读取来的数据存到指向的空间,第三个参数是希望读取的字节数,返回值表示成功读取的字节数。
  • 最终,close 将关闭一个文件。

对于命令行来讲,通过ls可以得到文件的属性,用代码怎么表示呢?

  • 我们有下面三个函数,可以返回与打开的文件描述符相关的文件状态信息。这个信息将会写到类型为struct stat的buf结构中
int stat(const char *pathname, struct stat *statbuf);
int fstat(int fd, struct stat *statbuf);
int lstat(const char *pathname, struct stat *statbuf);
 
 
struct stat {
  dev_t     st_dev;         /* ID of device containing file */
  ino_t     st_ino;         /* Inode number */
  mode_t    st_mode;        /* File type and mode */
  nlink_t   st_nlink;       /* Number of hard links */
  uid_t     st_uid;         /* User ID of owner */
  gid_t     st_gid;         /* Group ID of owner */
  dev_t     st_rdev;        /* Device ID (if special file) */
  off_t     st_size;        /* Total size, in bytes */
  blksize_t st_blksize;     /* Block size for filesystem I/O */
  blkcnt_t  st_blocks;      /* Number of 512B blocks allocated */
  struct timespec st_atim;  /* Time of last access */
  struct timespec st_mtim;  /* Time of last modification */
  struct timespec st_ctim;  /* Time of last status change */
};
  • 函数 stat 和 lstat 返回的是通过文件名查到的状态信息。这两个方法区别在于stat 没有处理符号链接(软链接)的能力。
    • 如果一个文件是符号链接,stat 会直接返回它所指向的文件的属性
    • 而 lstat 返回的就是这个符号链接的内容
  • fstat 则是通过文件描述符获取文件对应的属性。

接下来我们来看,如何使用系统调用列出一个文件夹下面的文件以及文件的属性

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <dirent.h>
 
 
int main(int argc, char *argv[])
{
  struct stat sb;
  DIR *dirp;
  struct dirent *direntp;
  char filename[128];
  if ((dirp = opendir("/root")) == NULL) {
    printf("Open Directory Error%s\n");
    exit(1);
  }
  while ((direntp = readdir(dirp)) != NULL){
    sprintf(filename, "/root/%s", direntp->d_name);
    if (lstat(filename, &sb) == -1)
    {
      printf("lstat Error%s\n");
      exit(1);
    }
 
 
    printf("name : %s, mode : %d, size : %d, user id : %d\n", direntp->d_name, sb.st_mode, sb.st_size, sb.st_uid);
 
 
  }
  closedir(dirp);
 
 
  return 0
}
  • opendir函数打开一个目录名为"/root"所对应的目录流,并返回执行DIR目录流的指针。流定位在DIR目录流的第一个条目
  • readdir 函数从 DIR 目录流中读取一个项目,返回的是一个指针,指向 dirent 结构体,且流的自动指向下一个目录条目。如果已经到流的最后一个条目,则返回 NULL。
  • closedir() 关闭参数 dir 所指的目录流。

总结

  • 在文件系统上,需要维护文件的严格的格式,需要通过mkfs.ext4命令来格式化为严格的格式
  • 每一个硬盘上保存的文件都要有一个索引,来维护这个文件上的数据块都保存在哪里
  • 文件通过文件夹组织起来,可以方便用户使用
  • 为了能够更快读取文件,内存里会分配一块空间作为缓存,让一些数据块放在缓存里面
  • 在内核中,要有一整套的数据结构来表示打开的文件
  • 在用户态,每个打开的文件都有一个文件描述符,可以通过个这种文件相关的系统调用,操作这个文件描述符

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值