参考:《深入理解计算机系统》《Unix环境高级编程》
开始本次旅行前我们先看两个例子
int main()
{
int fd;
char c;
fd = open("foobar.txt", O_RDONLY, 0);
if(fork()==0)
{
read(fd, &c, 1);
printf("c = %c\n",c);
exit(0);
}
wait(NULL);
read(fd, &c, 1);
printf("c = %c\n",c);
exit(0);
}
int main()
{
int fd1, fd2;
char c1, c2;
fd1 = open("foobar.txt", O_RDONLY, 0);
fd2 = open("foobar.txt", O_RDONLY, 0);
read(fd1, &c1, 1);
read(fd2, &c2, 1);
printf("c1 = %c\n", c1);
printf("c2 = %c\n", c2);
return 0;
}
上面的foobar.txt我们认为存储的的“foobar”,那么上面函数的输出是什么呢??
第一个例子输出:
c = f;
c = o;
第二个例子输出:
c1 = f;
c2 = f;
为什么会出现这种不同呢?下面我们来一一到来 。
Unix可以有很多种方式实现文件共享,除非你了解内核是如何打开文件的,不然你很难理解文件共享。内核使用三种相关的数据解构来打开文件。
描述符表:
每个进程都都有它独立的描述符表,他表示有该进程打开开的文件描述符的索引(每个open都有一个索引,即使你多次打开的同一个文件),每个表项表示一个文件描述符的索引。
文件表:
打开文件的集合是由一张文件表来表示的,所有的进程共享这个文件表,每个文件表的组成包含当
前文件表的位置,引用计数(即指向该文件的文件描述符的数目),等。我们关闭一个文件时,文件表的引用计数减-,内核不会删除这个文件表的表项,知道引用计数为0;
v-node表:
同文件表一样,所有进程共享这张表,这张表该文件的状态信息。
下面我们来就上面的两个例子看一下文件的图解:
上图第一幅图中就相当于,我们在一个进程中,通过连个open打来同一个file,虽然是同一个文件,但是,有两个不同的文件表项,所以通过不同的文件描述符操作时是通过不同的文件表来操作,所以互相不影响。
但是如果是像第一个例子所描述的那样,子进程是父进程的完全拷贝,同样也共享文件描述符合文件表,这样父子进程使用同样的文件描述符与文件表对文件进行访问(图2),所以会相互影响,这也就导致第一个程序运行的结果不同。当父子进程中有一个关闭文件时不会影响另一个进程,上面红体字已经表明文件的打开与否,与文件的引用计数有关,当fork时系统会将文件描述引用计数加1,这样即使其中一个关闭,但是文件的引用计数不是0,所以其他进程仍然可以访问该文件,(上面的图形中我们可以看到refcont是2)。当然如果一个进程,关闭自身的fd当然自身是不在有访问权限的,操作系统文件系统的操作就是这些,更多的大家可以参考《深入理解操作及系统》和《Unix环境高级编程》好了就写到这。。