预备知识:
https://blog.csdn.net/wwwlyj123321/article/details/100298377
一、什么是文件共享
(1)文件共享就是同一个文件(同一个文件指的是同一个inode,同一个pathname)被多个独立的读写体(几乎可以理解为多个文件描述符)去同时(一个打开尚未关闭的同时另一个去操作)操作。
(2)文件共享的意义有很多:譬如我们可以通过文件共享来实现多线程同时操作同一个大文件,以减少文件读写时间,提升效率。
二、文件共享的3种实现方式
- 第一种是同一个进程中多次使用open打开同一个文件
- 第二种是在不同进程中去分别使用open打开同一个文件(这时候因为两个fd在不同的进程中,所以两个fd的数字可以相同也可以不同)
- 第三种情况是linux系统提供了dup和dup2两个API来让进程复制文件描述符。
1、同一个进程中多次使用open打开同一个文件
每次open都会返回一个文件描述符,这两个文件描述符一定不同,分别指向各自的文件表,执行读写操作(read、write)有着各自的文件指针。
实验1:
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
int main(int argc, char *argv[])
{
int fd1 = -1, fd2 = -1; // fd 就是file descriptor,文件描述符
char buf[100] = {0};
char writebuf[20] = "l love linux";
int ret = -1;
// 第一步:打开文件
fd1 = open("a.txt", O_RDWR);
fd2 = open("a.txt", O_RDWR);
if ((-1 == fd1) || (fd2 == -1)) // 有时候也写成: (fd < 0)
{
perror("文件打开错误");
_exit(-1);
}
else
{
printf("文件打开成功,fd1 = %d. fd2 = %d.\n", fd1, fd2);
}
while(1)
{
// 读文件
memset(buf, 0, sizeof(buf));
ret = read(fd1, buf, 2);
if (ret < 0)
{
printf("read失败\n");
_exit(-1);
}
else
{
printf("fd1:[%s].\n", buf);
}
sleep(1);
// 读文件
memset(buf, 0, sizeof(buf));
ret = read(fd2, buf, 2);
if (ret < 0)
{
printf("read失败\n");
_exit(-1);
}
else
{
printf("fd2:[%s].\n", buf);
}
}
// 第三步:关闭文件
close(fd1);
close(fd2);
_exit(0);
}
备注:a.txt文件中内容:abcdabcdabcdabcdabcdabcdabcd
结论:我们可以看到,fd1和fd2分别读,这也证实了我们使用open两次打开同一个文件时,fd1和fd2所对应的文件指针是不同的2个独立的指针。
实验2:写实验(正常写)
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
int main(int argc, char *argv[])
{
int fd1 = -1, fd2 = -1; // fd 就是file descriptor,文件描述符
char buf[100] = {0};
char writebuf[20] = "l love linux";
int ret = -1;
// 第一步:打开文件
fd1 = open("a.txt", O_RDWR | O_TRUNC | O_CREAT , 0666);
fd2 = open("a.txt", O_RDWR | O_TRUNC | O_CREAT , 0666);
if ((-1 == fd1) || (fd2 == -1)) // 有时候也写成: (fd < 0)
{
perror("文件打开错误");
_exit(-1);
}
else
{
printf("文件打开成功,fd1 = %d. fd2 = %d.\n", fd1, fd2);
}
while (1)
{
// 第二步:读写文件
ret = write(fd1, "ab", 2);
if (ret < 0)
{
perror("write失败");
_exit(-1);
}
else
{
printf("write成功,写入了%d个字符\n", ret);
}
ret = write(fd2, "cd", 2);
if (ret < 0)
{
perror("write失败");
_exit(-1);
}
else
{
printf("write成功,写入了%d个字符\n", ret);
}
sleep(1);
}
// 第三步:关闭文件
close(fd1);
close(fd2);
_exit(0);
}
最终a.txt文件中的结果:cdcdcdcdcdcdcdcd
结论:默认情况下fd1和fd2分别写,由于是各自独立的文件表,但是指向的是同一块inode,fd1写完ab之后,fd2再写会把上次fd1写的覆盖,所以文件中只保留了cdcdcdcd.....
实验3:写实验(使用O_APPEND)
fd1 = open("a.txt", O_RDWR | O_TRUNC | O_CREAT|O_APPEND , 0666);
fd2 = open("a.txt", O_RDWR | O_TRUNC | O_CREAT|O_APPEND , 0666);
与实验2不同的是,在打开文件使用了O_APPEND标志,最终a.txt文件中的结果:
abcdabcdabcdabcdabcd。。。。。。
原因:如果用O_APPEND标志打开一个文件,则相应标志也被设置到文件表项的文件状态标志中. 每次对这种具有追加写标志的文件执行写操作时,文件表项中的当前文件偏移量首先会被设置为i节点表项中的文件长度,这就使得每次写入的数据都追加到文件的当前尾端处.
2、不同进程中多次使用open打开同一个文件
同样具有独立的文件表,指向同一个inode节点。所以实验效果跟同一进程打开同一个文件类似,唯一不同的是,文件描述符可能相等。
3、使用dup或dup2函数复制一个文件描述符
#include <unistd.h>
int dup(int oldfd);
dup用来复制参数oldfd所指的文件描述符。当复制成功时,返回最小的尚未被使用过的文件描述符,若有错误则返回-1.错误代码存入errno中。返回的新文件描述符和参数oldfd指向同一个文件表。
#include <unistd.h>
int dup2(int oldfd, int newfd);
dup2
与dup区别是dup2
可以用参数newfd
指定新文件描述符的数值。若参数newfd
已经被程序使用,则系统就会将newfd
所指的文件关闭,若newfd
等于oldfd
,则返回newfd
,而不关闭newfd
所指的文件。若dup2调用成功则返回新的文件描述符,出错则返回-1.
不论使用哪个API,所得到的效果如下示意图,新文件描述符和参数oldfd指向同一个文件表!
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#define FILENAME "1.txt"
int main(void)
{
int fd1 = -1, fd2 = -1;
fd1 = open(FILENAME, O_RDWR | O_CREAT | O_TRUNC, 0644);
if (fd1 < 0)
{
perror("open");
return -1;
}
printf("fd1 = %d.\n", fd1);
fd2 = dup2(fd1, 16);
printf("fd2 = %d.\n", fd2);
for(int i = 0; i<2; i++)
{
write(fd1, "hello\n", 6 );
write(fd2, "world\n", 6 );
sleep(1);
}
close(fd1);
close(fd2);
return -1;
}
最终1.txt中的结果如下:
hello
world
hello
world
结论:跟理论分析一样,接续写!
file 结构体中比较重要的成员还有f_count,表示引用计数(Reference Count),如dup 、fork 等系统调用会导致多个文件描述符指向同一 个file 结构体,例如有fd1 和fd2 都引用同一个file 结构体,那么它的引用计数就是2, 当close(fd1) 时并不会释放file 结构体,而只是把引用计数减到1,如果再close(fd2) ,引用计数 就会减到0同时释放file 结构体,这才真的关闭了文件。