Linux系统编程之文件IO
一、open函数
int open(char *pathname, int flags) #include <unistd.h>
参数:
pathname: 欲打开的文件路径名
flags:文件打开方式:#include <fcntl.h>
O_RDONLY|O_WRONLY|O_RDWR O_CREAT|O_APPEND|O_TRUNC|O_EXCL|O_NONBLOCK ....
返回值:
成功: 打开文件所得到对应的 文件描述符(整数)
失败: -1, 设置errno
int open(char *pathname, int flags, mode_t mode)
参数:
pathname: 欲打开的文件路径名
flags:文件打开方式:O_RDONLY|O_WRONLY|O_RDWR O_CREAT|O_APPEND|O_TRUNC|O_EXCL|O_NONBLOCK ....
mode: 参数3使用的前提, 参2指定了 O_CREAT。取值8进制数,用来描述文件的 访问权限。 rwx 0664
创建文件最终权限 = mode & ~umask
返回值:
成功: 打开文件所得到对应的 文件描述符(整数)
失败: -1, 设置errno
二、close函数
int close(int fd);
错误处理函数:与 errno 相关。
printf("xxx error: %d\n", errno);
char *strerror(int errnum);
printf("xxx error: %s\n", strerror(errno));
void perror(const char *s);
perror("open error");
三、read函数
ssize_t read(int fd, void *buf, size_t count);
参数:
fd:文件描述符
buf:存数据的缓冲区
count:缓冲区大小
返回值:
0:读到文件末尾。
成功; > 0 读到的字节数。
失败: -1, 设置 errno
-1: 并且 errno = EAGIN 或 EWOULDBLOCK, 说明不是read失败,而是read在以非阻塞方式读一个设备文件(网络文件),并且文件无数据。
四、write函数
ssize_t write(int fd, const void *buf, size_t count);
参数:
fd:文件描述符
buf:待写出数据的缓冲区
count:数据大小
返回值:
成功; 写入的字节数。
失败: -1, 设置 errno
五、dup 和 dup2
int dup(int oldfd); 文件描述符复制。
oldfd: 已有文件描述符
返回:新文件描述符。
int dup2(int oldfd, int newfd); 文件描述符复制。重定向。
fcntl 函数实现 dup:
int fcntl(int fd, int cmd, ....)
cmd: F_DUPFD
参3: 被占用的,返回最小可用的。
未被占用的, 返回=该值的文件描述符。
代码实现:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <fcntl.h>
#include <unistd.h>
#include <pthread.h>
int main(int argc, char *argv[])
{
int fd1 = open(argv[1], O_RDWR); // 012 --- 3
int fd2 = open(argv[2], O_RDWR); // 012 --- 3
int fdret = dup2(fd1, fd2); // 返回 新文件描述符fd2
printf("fdret = %d\n", fdret);
int ret = write(fd2, "1234567", 7); // 写入 fd1 指向的文件
printf("ret = %d\n", ret);
dup2(fd1, STDOUT_FILENO); // 将屏幕输入,重定向给 fd1所指向的文件.
printf("-----------------------------886\n");
return 0;
}
六、文件描述符
PCB进程控制块:本质 结构体。
成员:文件描述符表。
文件描述符:0/1/2/3/4。。。。/1023 表中可用的最小的。
0 - STDIN_FILENO
1 - STDOUT_FILENO
2 - STDERR_FILENO
七、阻塞、非阻塞
阻塞、非阻塞是设备文件、网络文件的属性。
产生阻塞的场景。 读设备文件。读网络文件。(读常规文件无阻塞概念。)
/dev/tty -- 终端文件。
open("/dev/tty", O_RDWR|O_NONBLOCK) --- 设置 /dev/tty 非阻塞状态。(默认为阻塞状态)
八、fcntl函数
int (int fd, int cmd, ...)
int flgs = fcntl(fd, F_GETFL);
flgs |= O_NONBLOCK
fcntl(fd, F_SETFL, flgs);
获取文件状态: F_GETFL
设置文件状态: F_SETFL
九、lseek函数
off_t lseek(int fd, off_t offset, int whence);
参数:
fd:文件描述符
offset: 偏移量
whence:起始偏移位置: SEEK_SET/SEEK_CUR/SEEK_END
返回值:
成功:较起始位置偏移量
失败:-1 errno
应用场景:
1. 文件的“读”、“写”使用同一偏移位置。
2. 使用lseek获取文件大小
3. 使用lseek拓展文件大小:要想使文件大小真正拓展,必须引起IO操作。
使用 truncate 函数,直接拓展文件。int ret = truncate("dict.cp", 250);
十、传入参数和传出参数
9.1 传入参数:
1. 指针作为函数参数。
2. 同常有const关键字修饰。
3. 指针指向有效区域, 在函数内部做读操作。
9.2 传出参数:
1. 指针作为函数参数。
2. 在函数调用之前,指针指向的空间可以无意义,但必须有效。
3. 在函数内部,做写操作。
4. 函数调用结束后,充当函数返回值。
9.3 传入传出参数:
1. 指针作为函数参数。
2. 在函数调用之前,指针指向的空间有实际意义。
3. 在函数内部,先做读操作,后做写操作。
4. 函数调用结束后,充当函数返回值。
十一、stat/lstat 函数
int stat(const char *path, struct stat *buf);
参数:
path: 文件路径。
buf:(传出参数) 存放文件属性。
返回值:
成功: 0
失败: -1 errno
获取文件大小: buf.st_size
获取文件类型: buf.st_mode
获取文件权限: buf.st_mode
符号穿透:stat会。lstat不会。
十二、link/unlink
隐式回收。
十三、目录操作函数
DIR * opendir(char *name);
int closedir(DIR *dp);
struct dirent *readdir(DIR * dp);
struct dirent {
inode
char dname[256];
}
代码实现:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <dirent.h>
#include <pthread.h>
int main(int argc, char *argv[])
{
DIR * dp;
struct dirent *sdp;
dp = opendir(argv[1]);
if (dp == NULL) {
perror("opendir error");
exit(1);
}
while ((sdp = readdir(dp)) != NULL) {
if ((strcmp(sdp->d_name, ".") == 0))
continue;
printf("%s\t", sdp->d_name);
}
printf("\n");
closedir(dp);
return 0;
}
十四、关于虚拟 4G 内存的描述和解析
一个进程用到的虚拟地址是由内存区域表来管理的,实际用不了 4G。而用到的内存区
域,会通过页表映射到物理内存。所以每个进程都可以使用同样的虚拟内存地址而不冲突,因为它们的物理地址实际上是不同的。
内核用的是 3G 以上的 1G 虚拟内存地址,其中 896M 是直接映射到物理地址的,128M 按需映射 896M 以上的所谓高位内存。各进程使用的是同一个内核。
首先要分清“可以寻址”和“实际使用”的区别。
其实我们讲的每个进程都有 4G 虚拟地址空间,讲的都是“可以寻址”4G,意思是虚拟
地址的 0-3G 对于一个进程的用户态和内核态来说是可以访问的,而 3-4G 是只有进程的内核态可以访问的。并不是说这个进程会用满这些空间。
其次,所谓“独立拥有的虚拟地址”是指对于每一个进程,都可以访问自己的 0-4G 的
虚拟地址。虚拟地址是“虚拟”的,需要转化为“真实”的物理地址。
好比你有你的地址簿,我有我的地址簿。你和我的地址簿都有 1、2、3、4 页,但是每
页里面的实际内容是不一样的,我的地址簿第 1 页写着 3,你的地址簿第 1 页写着 4,对于你、我自己来说都是用第 1 页(虚拟),实际上用的分别是第 3、4 页(物理),不冲突。
内核用的 896M 虚拟地址是直接映射的,意思是只要把虚拟地址减去一个偏移量(3G)
就等于物理地址。同样,这里指的还是寻址,实际使用前还是要分配内存。而且 896M 只是个最大值。如果物理内存小,内核能使用(分配)的可用内存也小。