2 文件IO

2.1 文件描述符

        对于内核而言,所有打开文件都由文件描述符引用。文件描述符是一个非负整数。当打开 一个现存文件或创建一个新文件时,内核向进程返回一个文件描述符。当读、写一个文件时, 用open或creat返回的文件描述符标识该文件,将其作为参数传送给 read或write。

        UNIX shell使文件描述符0与进程的标准输入相结合,文件描述符 1与标准输出 相结合,文件描述符2与标准出错输出相结合。

        幻数 0、1、2应被代换成符号常数 STDIN _ FILENO、STDOUT _ FILENO和STDERR_FILENO。

2.2 open函数

        调用open函数可以打开或创建一个文件。

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

//返回:若成功为文件描述符,若出错为- 1
//由open返回的文件描述符一定是最小的未用描述符数字
int open(const char *pathname , int oflag,.../*, mode_t mode * /) ; 

对于open函数而言,仅当创建新文件时才使用第三个参数。

        pathname是要打开或创建的文件的名字。oflag参数可用来说明此函数的多个选择项。用下列一个或多个常数进行或运算构成oflag参数(这些常数定义在<fcntl . h>头文件中):

  • O_RDONLY 只读打开。
  • O_WRONLY 只写打开。
  • O_RDWR 读、写打开。

这三个常数中只能指定一个。下列常数是可选择的:

  • O_APPEND        每次写时都加到文件的尾端。
  • O_CREAT           若此文件不存在则创建它。使用此选择项时,需同时说明第三个参数             mode, 用其说明该新文件的存取许可权位。 
  • O_EXCL              如果同时指定了O_CREAT,而文件已经存在,则出错。这可测试一个文件是 否存在,如果不存在则创建此文件成为一个原子操作。
  • O_TRUNC          如果此文件存在,而且为只读或只写成功打开,则将其长度截短为 0。
  • O_NOCTTY        如果pathname指的是终端设备,则不将此设备分配作为此进程的控制终端。
  • O_NONBLOCK   如果pathname指的是一个FIFO、一个块特殊文件或一个字符特殊文件, 则此选择项为此文件的本次打开操作和后续的 I / O操作设置非阻塞方式。
  • O_SYNC             使每次write都等到物理I / O操作完成。

2.3 create函数

creat函数创建一个新文件。

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

//返回:若成功为只写打开的文件描述符,若出错为- 1
int creat(const char *pathname, mode_t mode) ;


//这个函数等效于:
open (pathname, O_WRONLY|O_CREAT|O_TRUNC, mode) ;

2.4 close函数

用close函数关闭一个打开文件:

#include <unistd.h>
int close (int filedes);

        关闭一个文件时也释放该进程加在该文件上的所有记录锁。当一个进程终止时,它所有的打开文件都由内核自动关闭。

2.5 lseek函数

        每个打开文件都有一个与其相关联的“当前文件位移量”。它是一个非负整数,用以度量 从文件开始处计算的字节数。一般来说,读、写操作都从当前文件位移量处开始,并使位移量增加所读或写的字节数。按系统默认,当 打开一个文件时,除非指定O_APPEND选择项,否则该位移量被设置为0。

可以调用lseek显式地定位一个打开文件。

#include <sys/types.h>
#include <unistd.h>

//返回:若成功为新的文件位移,若出错为- 1
off_t lseek(int filedes, off_t offset, int whence) ;

        对参数offset 的解释与参数whence的值有关。

  • 若whence是SEEK_SET,则将该文件的位移量设置为距文件开始处offset 个字节。
  • 若whence是SEEK_CUR,则将该文件的位移量设置为其当前值加offset, offset可为正或负。
  • 若whence是SEEK_END,则将该文件的位移量设置为文件长度加offset, offset可为正或负。
  • 若lseek成功执行,则返回新的文件位移量,为此可以用下列方式确定一个打开文件的当前位移量:
off_t currpos;
currpos = lseek(fd, 0, SEEK_CUR);

        这种方法也可用来确定所涉及的文件是否可以设置位移量。如果文件描述符引用的是一个管道或FIFO,则lseek返回-1,并将errno设置为EPIPE。

2.6 read函数

#include <unistd.h>

//返回:读到的字节数,若已到文件尾为 0,若出错为-1
ssize_t read(int filedes, void *buff, size_t nbytes) ;

        如read成功,则返回读到的字节数。如已到达文件的尾端,则返回 0。 有多种情况可使实际读到的字节数少于要求读字节数:

  • 读普通文件时,在读到要求字节数之前已到达了文件尾端。例如,若在到达文件尾端之前还有30个字节,而要求读100个字节,则read返回30,下一次再调用read时,它将返回0 (文件 尾端)。
  • 当从终端设备读时,通常一次最多读一行。
  • 当从网络读时,网络中的缓冲机构可能造成返回值小于所要求读的字节数。
  • 某些面向记录的设备,例如磁带,一次最多返回一个记录。 读操作从文件的当前位移量处开始,在成功返回之前,该位移量增加实际读得的字节数。

2.7 write函数

#include <unistd.h>

//返回:若成功为已写的字节数,若出错为- 1
ssize_t write(int filedes, const void * buff, size_t nbytes) ;

        其返回值通常与参数nbytes的值不同,否则表示出错。write出错的一个常见原因是:磁盘已写满,或者超过了对一个给定进程的文件长度限制。

2.8 文件共享

        UNIX支持在不同进程间共享打开文件。内核使用了三种I/O的数据结构,它们之间的关系决定了在文件共享方面一个进程对另一个进程 可能产生的影响。

(1)每个进程在进程表中都有一个记录项,每个记录项中有一张打开文件描述符表,可将其视为一个矢量,每个描述符占用一项。与每个文件描述符相关联的是:

        (a)文件描述符标志。

        (b)指向一个文件表项的指针。

(2)内核为所有打开文件维持一张文件表。每个文件表项包含:

        (a)文件状态标志(读、写、增写、同步、非阻塞等)。

        (b)当前文件位移量。

        (c)指向该文件v节点表项的指针。

(3)每个打开文件(或设备)都有一个 v节点结构。 v节点包含了文件类型和对此文件进行各种操作的函数的指针信息。对于大多数文件, v节点还包含了该文件的i节点(索引节点)。这些信息是在打开文件时从盘上读入内存的,所以所有关于文件的信息都是快速可供使用的。例如, i节点包含了文件的所有者、文件长度、文件所在的设备、指向文件在盘上所使用的实际数据块的指针等等。

打开文件的内核数据结构

        如果两个独立进程各自打开了同一文件,则有下图中所示的安排。我们假定第一个进程使该文件在文件描述符 3上打开,而另一个进程则使此文件在文件描述符 4上打开。打开此文件的每个进程都得到一个文件表项,但对一个给定的文件只有一个 v节点表项。每个进程都有自己的文件表项的一个理由是:这种安排使每个进程都有它自己的对该文件的当前位移量。 

两个独立进程各自打开同一个文件

 

  • 在完成每个write后,在文件表项中的当前文件位移量即增加所写的字节数。如果这使当前文件位移量超过了当前文件长度,则在i节点表项中的当前文件长度被设置为当前文件位移 量(也就是该文件加长了)。
  • 如果用O_APPEND标志打开了一个文件,则相应标志也被设置到文件表项的文件状态标志中。每次对这种具有添写标志的文件执行写操作时,在文件表项中的当前文件位移量首先被设置为i节点表项中的文件长度。这就使得每次写的数据都添加到文件的当前尾端处。
  • lseek函数只修改文件表项中的当前文件位移量,没有进行任何 I / O操作。
  • 若一个文件用lseek被定位到文件当前的尾端,则文件表项中的当前文件位移量被设置为 i 节点表项中的当前文件长度。 可能有多个文件描述符项指向同一文件表项。

2.9 原子操作

2.9.1 添加至一个文件

        假定有两个独立的进程A和B,都对同一文件进行添加操作。每个进程都已打开了该文件, 但未使用O_APPEND标志。此时每个进程都有它自己的文件表项,但是共享一个v节点表项。假定进程A调用了lseek,进程B也调用了lseek,这时如果有一个进程写了数据,那么文件的长度就会发生改变,就会影响另一个进程的操作。

        UNIX提供了一种方法使这种操作成为原子操作,其方法就是在打开文件时设置 O_APPEND标志。使内核每次对这种文件进行写之前,都将进程的当前位移量设置到该文件的尾端处,于是在每次写之前就不再需要调用 lseek。

2.10 dup和dup2函数

两个函数都可用来复制一个现存的文件描述符:

#include <unistd.h>

//两函数的返回:若成功为新的文件描述符,若出错为- 1
int dup(int filedes) ;
int dup2(int filedes, int filedes2) ;

        由dup返回的新文件描述符一定是当前可用文件描述符中的最小数值。用dup2则可以用filedes2参数指定新描述符的数值。如果filedes2已经打开,则先将其关闭。如若filedes等于filedes2,则dup2返回filedes2,而不关闭它。

2.11 fcntl函数

        fcntl函数可以改变已经打开文件的性质。

#include <sys/types.h>
#include <unistd.h>
#include <fcntl.h>

//返回:若成功则依赖于cmd,若出错为-1
int fcntl(int filedes, int cmd,.../* int arg * / ) ;

fcntl函数有五种功能:

• 复制一个现存的描述符(cmd=F_DUPFD)。

• 获得/设置文件描述符标记(cmd = F_GETFD或F_SETFD)。

• 获得/设置文件状态标志(cmd = F_GETFL或F_SETFL)。

• 获得/设置异步I / O有权(cmd = F_GETOWN或F_SETOWN)。

• 获得/设置记录锁(cmd = F_GETLK , F_SETLK或F_SETLKW)。

文件状态标志说 明
O_RDONLY只读打开
O_WRONLY只写打开
O_RDWR读/写打开
O_APPEND写时都添加至文件尾
O_NONBLOCK非阻塞方式
O_SYNC等待写完成
O_ASYNC异步I / O

2.12 ioctl函数

        ioctl 函数是I / O操作的杂物箱。不能用本章中其他函数表示的 I / O操作通常都能用ioctl表示。 终端I / O是ioctl 的最大使用方面。

#include <unistd.h> 
#include <sys/ioctl.h> 

//返回:若出错则为- 1,若成功则为其他值
int ioctl(int f i l e d e s, int re q u e s t, . . . ) ;

2.13 /dev/fd

        比较新的系统都提供名为 /dev/fd的目录,其目录项是名为 0、1、2等的文件。打开文件/dev/fd/n等效于复制描述符n。

fd = open("/dev/fd/0", mode);

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值