文件IO
Linux系统中大多数IO只需要5个函数:open,read,write,lseek,以及close。
文件描述符
对于内核而言,所有打开的文件都通过文件描述符
引用。当打开一个现有文件或创建一个新文件时,内核向进程返回一个文件描述符。当读、写一个文件时,使用open或creat返回的文件描述符标识该文件,将其作为参数传送给read或write。
简单的来说,当直接用open打开一个文件时,也会产生一个包含文件所有信息的结构体,系统不会把这个结构体对外显示,只会把结构体的地址存储在一个指针数组中,然后将数组的下标返回给用户,供用户调用,这个下标就是文件描述符
。
- 文件描述符是一个非负整数。
- 是一个指针数组的下标
- 文件描述符优先使用当前可用范围内最小的(举个例子:现在先假设数组的0~50下标都存放了信息,再打开文件产生的地址就紧跟其后存放;如果此时,下标5的位置存储文件信息的结构体被free掉了,那么再打开文件产生的地址就必须存放在下标5的位置而不能存储到下标5后面的位置)
- 文件描述符的变化范围是 0~OPEN_MAX-1 (OPEN_MAX-1:每个进程最大打开文件数)
按照惯例,UNIX系统shell把
- 文件描述符 0 与进程的标准输入关联
- 文件描述符 1 与进程的标准输出关联
- 文件描述符 2 与进程的标准错误关联
也就是说上图中指针数组的下标0、1、2位置存放的就是关联标准输入、输出、出错的位置信息。
现在有个问题:这个指针数组的大小是多少呢?该数组存储在什么位置呢?
这个指针数组的大小取决于一个进程空间中最多所能存在的文件个数,默认一个系统中有1021+3个标准流;共1024个。这个1024就是数组的大小。
如果用ulimit命令更改一个进程空间中最多所能存在的文件个数,其本质就是在更改该数组的大小。