Linux 系统编程笔记-(2)文件I/O

文件I/O:通用的I/O模型

目录

文件I/O:通用的I/O模型

1.open(), close(), read(), write()系统调用

2.改变文件偏移量: lseek()

文件空洞

3.函数ioctl(),麻雀虽小,五脏俱全!


1.open(), close(), read(), write()系统调用

Linux系统中"万物皆文件".包括普通文件,设备,管道,套接字,目录以及符号链接.

所有执行I/O操作的API都通过文件描述符(一个非负整数)来指代打开的文件.

一般的,程序运行时,会继承shell中3个标准文件描述符的副本,这三个描述符指代了标准输入,标准输出和标准错误.

/* Standard file descriptors.  */
#define	STDIN_FILENO	0	/* Standard input.  */
#define	STDOUT_FILENO	1	/* Standard output.  */
#define	STDERR_FILENO	2	/* Standard error output.  */
文件描述符用途POSIX名称
0标准输入STDIN_FILENO
1标准输出STDOUT_FILENO
2标准错误STDERR_FILENO

注意:标准库提供了重定向文件流的函数,freopen()函数.

函数名:freopen()

作用:关联一个新的文件名与给定的打开流,同时关闭旧文件流。

声明:

FILE *freopen(const char *filename, const char *mode, FILE *stream)

参数:

  • filename -- 这是C字符串,其中包含要打开的文件名。

  • mode -- 这是C字符串,其中包含文件访问模式。它包括:

mode描述
"r"打开一个文件进行读取。该文件必须存在。
"w"创建一个空的书面文件。如果已经存在具有相同名称的文件,其内容被删除的文件被认为是一个新的空文件。
"a"附加到文件中。写入操作的数据追加在文件末尾的。该文件被创建,如果它不存在。
"r+"打开更新文件阅读和写作。该文件必须存在。
"w+"创建一个空文件,读取和写入。
"a+"打开一个文件​​读取和追加。

下面通过代码来介绍4个主要的系统调用,open(), read(), write()和close()


/**
 * 通过系统调用read, write, open, close实现拷贝文件的功能
 * @param src 源文件名
 * @param dest 目标文件名
 */
int copy(const char *src, const char *dest)
{
    const int BUF_SIZ = 8196;
    char buf[BUF_SIZ];
    int readFd, writeFd, readCount;
    int openFlags = O_RDONLY;   //以只读权限读取文件
    int writeFlags = O_WRONLY | O_CREAT | O_TRUNC;  //以只写权限写入文件,若文件不存在则创建文件,若文件已经存在,则截断原文件
    int writePerms = S_IRUSR | S_IWUSR | S_IRGRP | S_IWGRP | S_IROTH | S_IWOTH;  //定义写后权限具有的权限 rw-rw-rw-
    //等效与 int writePerms = 0666
    if ((readFd = open(src, openFlags)) == -1) {    //错误返回-1
        printf("couldn't open %s.\n", src);
        return -1;
    }
    if ((writeFd = open(dest, writeFlags, writePerms)) == -1) {
        printf("couldn't create %s.\n", src);
        close(readFd);
        return -1;
    }
    while ((readCount = read(readFd, buf, BUF_SIZ)) > 0) {  //read函数返回真实读取个数
        if ((write(writeFd, buf, readCount)) != readCount) {
            printf("couldn't write whole buffer\n");
        }
    }
    if (readCount == -1) {  //读取出错则返回-1
        printf("read error\n");
    }
    if (close(readFd) == -1)
        printf("close error");
    if (close(writeFd) == -1)
        printf("close error");
    return 0;
}

这个程序很基础,要注意的点是:

  • 打开的程序要记得关闭
  • 不要忘了判断系统调用是否正确,可以通过函数返回值来判断
表2: open()系统调用的flags参数值介绍
标志用途统一UNIX规范版本
O_RDONLY以只读方式打开v3
O_WRONLY以只写方式打开v3
O_RDWR以读写方式打开v3
O_CLOEXEC设置close-on-exec标志v4
O_CREAT若文件不存在则创建v3
O_DIRECTORY如果pathname不是目录,则失败v4
O_DIRECT无缓存的输入/输出
O_EXCL

结合O_CREAT参数使用,创建文件时

若文件存在则失败

v3
O_LARGEFILE在32位系统中使用此标志打开大文件
O_NOATIME调用read()时,不修改文件的最近访问时间
O_NOCTTY不要让pathname成为控制终端v3
O_NOFOLLOW不自动对符号链接解引用v4
O_TRUNC截断已有文件,使其长度为零v3
O_APPEND在文件尾部追加数据v3
O_ASYNC当I/O操作可行时,产生信号(signal)通知进程
O_DSYNC提供同步的I/O数据完整性v3
O_NONBLOCK以非阻塞方式打开v3
O_SYNC以同步方式写入文件v3

若打开文件时发生错误,open()会返回-1,错误的原因会存储在全局变量errno中 

表3: open()系统调用的错误
EACCESS权限不够,可能是目录权限的限制,或文件不存在但无法创建文件
EISDIR如果调用者企图打开文件,则会出错
EMFILE进程打开的文件描述符达到了上限
ENOENT
  • 文件不存在且未指定O_CREAT
  • 指定了O_CREAT但pathname参数所指定的文件路径不存在
  • pathname是符号链接,对符号链接解引用时其指向的链接不存在
EROFS试图以写方式打开只读文件系统
ETXTBSY试图打开正在执行的文件

2.改变文件偏移量: lseek()

对与每个打开的文件,系统内核会记录其文件偏移量,文件偏移量也称偏移量或指针.

文件打开时,会将文件偏移量设置为指向文件开始,若指定了O_APPEND则偏移量为文件末尾.

每次read()或write()调用将自动对其进行调整,以指向已读或已写数据后的下一字节.

lseek可以显示的改变文件偏移量.

#include <unistd.h>
off_t lseek(int fd, off_t offset, int whence);
调用成功则返回文件的新偏移量,失败返回-1
注意:offset可以为负数
表4: whence参数的值
SEEK_SET将文件偏移量设置为从文件头部起始点开始的offset个字节
SEEK_CUR从当前文件偏移量调整offset个字节
SEEK_END从文件尾调整offset个字节

文件空洞

如果文件的偏移量跨越了文件结尾,然后再执行I/O操作,会发生什么?

答:文件结尾后到新写入数据间这段空间被称做文件空洞.

从编程的角度来看,文件空洞是存在字节的,读取空洞会返回0.

但是!空洞不会占用任何磁盘空间!这带来的好处是,降低稀疏存储文件所占用的空间.

下面直接给出示例代码:

#include <stdio.h>
#include <gnu/libc-version.h>
#include <time.h>
#include <unistd.h>
#include <fcntl.h>
#include <errno.h>
#include <string.h>
#include <stdlib.h>
#include <ctype.h>

int main(int argc, const char *argv[])
{
    size_t len;
    off_t offset;
    int fd, i, j;
    char *buf;
    ssize_t numRead, numWritten;

    if (argc < 3 || strcmp(argv[1], "--help") == 0) {
        printf("%s file {r<length>|R<length>|w<string>|s<offset>}\n", argv[0]);
        return 0;
    }

    if ((fd = open(argv[1], O_RDWR | O_CREAT, 0666)) == -1) { //rw-rw-rw
        printf("open error.\n");
        return 0;
    }

    for (i = 2; i < argc; ++i) {
        switch (argv[i][0]) {
            case 'r'://以字符形式显示字符串
            case 'R'://以8进制形式显示字符串

                len = atoi(argv[i] + 1);
                if ((buf = malloc(len)) == NULL) {
                    printf("malloc error");
                    return 0;
                }
                if ((numRead = read(fd, buf, len)) == -1) {
                    printf("read error");
                    return 0;
                }
                printf("%s: ", argv[i]);
                for (j = 0; j < numRead; ++j) {
                    if (argv[i][0] == 'r')
                        printf("%c", isprint(buf[j]) ? buf[j] : '?');
                    else
                        printf("%02x ", (unsigned int)buf[j]);
                }

                putchar('\n');
                break;
            case 'w': //在当前偏移量写入字符串
                if ((numWritten = write(fd, argv[i] + 1, strlen(argv[i] + 1))) == -1) {
                    printf("write error");
                    return 0;
                }
                printf("%s: wrote %ld bytes.\n", argv[i] + 1, numWritten);
                break;
            case 's':
                offset = atoi(argv[i] + 1);
                if (lseek(fd, offset, SEEK_SET) != -1) {
                    printf("%s: seek successed\n", argv[i]);
                }
                break;
        }
    }

    close(fd);  //记得关闭文件

    return 0;
}

上述代码可以对一个文件进行设置偏移量并读写的功能

$ touch tfile        创建一个空文件名为tfile
$ ./a.out tfile s1000 whello_world    将文件偏移量定位到文件开头后的1000字节处
s1000: seek successed
hello_world: wrote 11 bytes.
$ ls -l tfile                         查看文件大小 发现大小为1011字节
-rw-r--r-- 1 wgy wgy 1011 2月   3 20:42 tfile
$ ./a.out tfile s995 r20                从文件开头后995偏移量处开始度去20字节,以文本形式显示
s995: seek successed
r20: ?????hello_world
$ ./a.out tfile s995 R20
s995: seek successed                    从文件开头后995偏移量处开始度去20字节,以八进制形式显示
R20: 00 00 00 00 00 68 65 6c 6c 6f 5f 77 6f 72 6c 64 

可以看到,文件的大小改变了,空洞以0字节填充.

3.函数ioctl(),麻雀虽小,五脏俱全!

次函数等以后讲解原子操作以及这对于文件操作的重要性时再介绍

友情链接:https://www.uancg.cc

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值