文件I/O:通用的I/O模型
目录
1.open(), close(), read(), write()系统调用
1.open(), close(), read(), write()系统调用
Linux系统中"万物皆文件".包括普通文件,设备,管道,套接字,目录以及符号链接.
所有执行I/O操作的API都通过文件描述符(一个非负整数)来指代打开的文件.
一般的,程序运行时,会继承shell中3个标准文件描述符的副本,这三个描述符指代了标准输入,标准输出和标准错误.
/* Standard file descriptors. */
#define STDIN_FILENO 0 /* Standard input. */
#define STDOUT_FILENO 1 /* Standard output. */
#define STDERR_FILENO 2 /* Standard error output. */
文件描述符 | 用途 | POSIX名称 |
0 | 标准输入 | STDIN_FILENO |
1 | 标准输出 | STDOUT_FILENO |
2 | 标准错误 | STDERR_FILENO |
注意:标准库提供了重定向文件流的函数,freopen()函数.
函数名:freopen()
作用:关联一个新的文件名与给定的打开流,同时关闭旧文件流。
声明:
FILE *freopen(const char *filename, const char *mode, FILE *stream)
参数:
-
filename -- 这是C字符串,其中包含要打开的文件名。
-
mode -- 这是C字符串,其中包含文件访问模式。它包括:
mode | 描述 |
---|---|
"r" | 打开一个文件进行读取。该文件必须存在。 |
"w" | 创建一个空的书面文件。如果已经存在具有相同名称的文件,其内容被删除的文件被认为是一个新的空文件。 |
"a" | 附加到文件中。写入操作的数据追加在文件末尾的。该文件被创建,如果它不存在。 |
"r+" | 打开更新文件阅读和写作。该文件必须存在。 |
"w+" | 创建一个空文件,读取和写入。 |
"a+" | 打开一个文件读取和追加。 |
下面通过代码来介绍4个主要的系统调用,open(), read(), write()和close()
/**
* 通过系统调用read, write, open, close实现拷贝文件的功能
* @param src 源文件名
* @param dest 目标文件名
*/
int copy(const char *src, const char *dest)
{
const int BUF_SIZ = 8196;
char buf[BUF_SIZ];
int readFd, writeFd, readCount;
int openFlags = O_RDONLY; //以只读权限读取文件
int writeFlags = O_WRONLY | O_CREAT | O_TRUNC; //以只写权限写入文件,若文件不存在则创建文件,若文件已经存在,则截断原文件
int writePerms = S_IRUSR | S_IWUSR | S_IRGRP | S_IWGRP | S_IROTH | S_IWOTH; //定义写后权限具有的权限 rw-rw-rw-
//等效与 int writePerms = 0666
if ((readFd = open(src, openFlags)) == -1) { //错误返回-1
printf("couldn't open %s.\n", src);
return -1;
}
if ((writeFd = open(dest, writeFlags, writePerms)) == -1) {
printf("couldn't create %s.\n", src);
close(readFd);
return -1;
}
while ((readCount = read(readFd, buf, BUF_SIZ)) > 0) { //read函数返回真实读取个数
if ((write(writeFd, buf, readCount)) != readCount) {
printf("couldn't write whole buffer\n");
}
}
if (readCount == -1) { //读取出错则返回-1
printf("read error\n");
}
if (close(readFd) == -1)
printf("close error");
if (close(writeFd) == -1)
printf("close error");
return 0;
}
这个程序很基础,要注意的点是:
- 打开的程序要记得关闭
- 不要忘了判断系统调用是否正确,可以通过函数返回值来判断
标志 | 用途 | 统一UNIX规范版本 |
O_RDONLY | 以只读方式打开 | v3 |
O_WRONLY | 以只写方式打开 | v3 |
O_RDWR | 以读写方式打开 | v3 |
O_CLOEXEC | 设置close-on-exec标志 | v4 |
O_CREAT | 若文件不存在则创建 | v3 |
O_DIRECTORY | 如果pathname不是目录,则失败 | v4 |
O_DIRECT | 无缓存的输入/输出 | |
O_EXCL | 结合O_CREAT参数使用,创建文件时 若文件存在则失败 | v3 |
O_LARGEFILE | 在32位系统中使用此标志打开大文件 | |
O_NOATIME | 调用read()时,不修改文件的最近访问时间 | |
O_NOCTTY | 不要让pathname成为控制终端 | v3 |
O_NOFOLLOW | 不自动对符号链接解引用 | v4 |
O_TRUNC | 截断已有文件,使其长度为零 | v3 |
O_APPEND | 在文件尾部追加数据 | v3 |
O_ASYNC | 当I/O操作可行时,产生信号(signal)通知进程 | |
O_DSYNC | 提供同步的I/O数据完整性 | v3 |
O_NONBLOCK | 以非阻塞方式打开 | v3 |
O_SYNC | 以同步方式写入文件 | v3 |
若打开文件时发生错误,open()会返回-1,错误的原因会存储在全局变量errno中
EACCESS | 权限不够,可能是目录权限的限制,或文件不存在但无法创建文件 |
EISDIR | 如果调用者企图打开文件,则会出错 |
EMFILE | 进程打开的文件描述符达到了上限 |
ENOENT |
|
EROFS | 试图以写方式打开只读文件系统 |
ETXTBSY | 试图打开正在执行的文件 |
2.改变文件偏移量: lseek()
对与每个打开的文件,系统内核会记录其文件偏移量,文件偏移量也称偏移量或指针.
文件打开时,会将文件偏移量设置为指向文件开始,若指定了O_APPEND则偏移量为文件末尾.
每次read()或write()调用将自动对其进行调整,以指向已读或已写数据后的下一字节.
lseek可以显示的改变文件偏移量.
#include <unistd.h>
off_t lseek(int fd, off_t offset, int whence);
调用成功则返回文件的新偏移量,失败返回-1
注意:offset可以为负数
SEEK_SET | 将文件偏移量设置为从文件头部起始点开始的offset个字节 |
SEEK_CUR | 从当前文件偏移量调整offset个字节 |
SEEK_END | 从文件尾调整offset个字节 |
文件空洞
如果文件的偏移量跨越了文件结尾,然后再执行I/O操作,会发生什么?
答:文件结尾后到新写入数据间这段空间被称做文件空洞.
从编程的角度来看,文件空洞是存在字节的,读取空洞会返回0.
但是!空洞不会占用任何磁盘空间!这带来的好处是,降低稀疏存储文件所占用的空间.
下面直接给出示例代码:
#include <stdio.h>
#include <gnu/libc-version.h>
#include <time.h>
#include <unistd.h>
#include <fcntl.h>
#include <errno.h>
#include <string.h>
#include <stdlib.h>
#include <ctype.h>
int main(int argc, const char *argv[])
{
size_t len;
off_t offset;
int fd, i, j;
char *buf;
ssize_t numRead, numWritten;
if (argc < 3 || strcmp(argv[1], "--help") == 0) {
printf("%s file {r<length>|R<length>|w<string>|s<offset>}\n", argv[0]);
return 0;
}
if ((fd = open(argv[1], O_RDWR | O_CREAT, 0666)) == -1) { //rw-rw-rw
printf("open error.\n");
return 0;
}
for (i = 2; i < argc; ++i) {
switch (argv[i][0]) {
case 'r'://以字符形式显示字符串
case 'R'://以8进制形式显示字符串
len = atoi(argv[i] + 1);
if ((buf = malloc(len)) == NULL) {
printf("malloc error");
return 0;
}
if ((numRead = read(fd, buf, len)) == -1) {
printf("read error");
return 0;
}
printf("%s: ", argv[i]);
for (j = 0; j < numRead; ++j) {
if (argv[i][0] == 'r')
printf("%c", isprint(buf[j]) ? buf[j] : '?');
else
printf("%02x ", (unsigned int)buf[j]);
}
putchar('\n');
break;
case 'w': //在当前偏移量写入字符串
if ((numWritten = write(fd, argv[i] + 1, strlen(argv[i] + 1))) == -1) {
printf("write error");
return 0;
}
printf("%s: wrote %ld bytes.\n", argv[i] + 1, numWritten);
break;
case 's':
offset = atoi(argv[i] + 1);
if (lseek(fd, offset, SEEK_SET) != -1) {
printf("%s: seek successed\n", argv[i]);
}
break;
}
}
close(fd); //记得关闭文件
return 0;
}
上述代码可以对一个文件进行设置偏移量并读写的功能
$ touch tfile 创建一个空文件名为tfile
$ ./a.out tfile s1000 whello_world 将文件偏移量定位到文件开头后的1000字节处
s1000: seek successed
hello_world: wrote 11 bytes.
$ ls -l tfile 查看文件大小 发现大小为1011字节
-rw-r--r-- 1 wgy wgy 1011 2月 3 20:42 tfile
$ ./a.out tfile s995 r20 从文件开头后995偏移量处开始度去20字节,以文本形式显示
s995: seek successed
r20: ?????hello_world
$ ./a.out tfile s995 R20
s995: seek successed 从文件开头后995偏移量处开始度去20字节,以八进制形式显示
R20: 00 00 00 00 00 68 65 6c 6c 6f 5f 77 6f 72 6c 64
可以看到,文件的大小改变了,空洞以0字节填充.
3.函数ioctl(),麻雀虽小,五脏俱全!
次函数等以后讲解原子操作以及这对于文件操作的重要性时再介绍
友情链接:https://www.uancg.cc