Linux学习第三天（open、read、write函数）

最新推荐文章于 2024-02-22 14:54:02 发布

weixin_43870645

最新推荐文章于 2024-02-22 14:54:02 发布

阅读量551

点赞数

文章标签： linux 学习服务器 Powered by 金山文档

本文链接：https://blog.csdn.net/weixin_43870645/article/details/129532532

版权

标准C库I/O函数和linux中I/O函数的区别

缓冲区的刷新办法：

--通过fflush函数对缓冲区进行刷新

--缓冲区已满

--正常关闭文件：fclose、return（main函数）、exit（main函数）

用户程序调用C标准I/O库，然后C标准I/O函数调用内核的write、read对磁盘进行操作

因此两者是一个上下级的关系

一般来说，我们认为linux是没有缓冲区的，实际上时有的

Linux的I/O实际上是有缓冲区的，只不过它采用了一种不同于传统操作系统的缓存机制。在Linux中，所有文件都被视为一个流（stream），而这个流可以被分成多个块（block）。每当应用程序请求读取或写入数据时，内核会将数据从磁盘读入到内存中，并将其放置在一个称为页缓存（page cache）的高速缓存中。

与传统操作系统不同之处在于，在Linux中，应用程序并不能直接访问页缓存。相反，它必须通过调用标准I/O库函数来进行读取和写入操作。这些函数会自动管理页缓存，并确保数据正确地从磁盘到达应用程序。

因此，在Linux中虽然没有显式的用户空间输入输出缓冲区，但是内核提供了高效且透明的页缓存机制来优化文件I/O性能。

虚拟地址空间

Linux将整个虚拟地址空间分为两部分：用户空间和内核空间。用户空间用于存储应用程序代码、数据以及堆栈等信息，而内核空间则保留给操作系统使用。

在32位架构下，Linux将4GB的虚拟地址空间划分为两部分：3GB供用户态使用，1GB供内核态使用；而64位架构下，则将128TB的虚拟地址划分为了512TB供用户态使用，剩余部分仍然由内核占据。

文件描述符

在linux中，文件描述符（File Descriptor）是一个用于访问文件或其他输入/输出资源的整数标识符。

每个进程都有一张打开文件的表格，其中存储了该进程所打开的所有文件及其相关信息。而这些打开的文件都会被分配一个唯一的数字标识符，即为“文件描述符”。

通常情况下，0、1和2分别代表标准输入、标准输出和标准错误输出。当程序需要读取数据时，它将从stdin（即0号描述符）中读取；当程序需要向屏幕上显示消息时，则会使用stdout（即1号描述符）。如果发生错误，则可以将错误信息写入stderr（即2号描述符）。

open函数读写现有文件

linux的open函数有两个重载形式

int open(const char* pathname,int flags);
int open(const char* pathname,int flags,mode_t mode);
参数：
    -pathname是文件的路径
    -flags是操作权限和其他设置：三个必选项是O_RDONLY,O_WRONLY,O_RDWR,分别表示仅可读、仅可写和允许读写，flags是一个32位的参数，每一位就是一个标志位，因此多条件需要用或
    -mode是一个8进制的数，表示用户对新创建文件的操作权限

返回值：
    -返回一个新的文件描述符或者-1（错误）

open函数需要一些头文件

#include<sys/types.h>
#include<sys/stat.h>
//flags定义在前两个头文件中
#include<fcntl.h>
//open函数在这里定义

针对打开失败出现的错误，我们也有函数进行输出

errno：属于linux的系统函数库，是库里面的一个全局变量，记录的是最近的错误号

#include<stdio.h>
void perror(const char *s)//s为用户自己定义的错误描述
该函数的作用是打印errno对应的错误描述
输出格式：
    "s:标准错误原因"

针对第一个open函数，我们可以写出以下的代码

#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<stdio.h>
#include<unistd.h>
int main(){
    //打开文件
    int fd = open("a.txt",O_RDONLY);//返回一个文件描述符用fd接收
    if(fd == -1){//打开失败
        perror("open失败");
    }
    //读写操作
    //关闭
    close(fd);
    //close函数的头文件是unistd.h
    return 0;
}

在上述代码中，如果a.txt不存在，open函数返回-1。perror函数输出

"open失败：No such file or directory"

5.open函数创建文件

#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<stdio.h>
#include<unistd.h>
int main(){
    //创建新文件
    int fd = open("create.txt",O_RDWR|O_CREAT，0777);
    if(fd == -1){
        perror("创建失败");
    close(fd);
    return 0;
}

解释一下0777的意义

我们在终端中输入ll后可以看到
-rwxrwxrwx三个一组，分别表示当前用户、当前用户所在组和其他用户所在组的权限
0777 = 111 111 111 ，0代表8进制，对应着rwx权限
-x表示可执行（Execute）
最终的结果是 mode & ~umask
不同用户的umask掩码不同，作用是抹去某些权限
由于umask值为0002，因此会从777这个初始值中减去002得到775作为实际使用值。
umask的作用是抹去某些权限

write和read函数

#include<unistd.h>
ssize_t read(int fd,void *buf,size_t count)
//ssize_t是一种有符号整数类型，通常用于表示读取或写入操作的字节数。它可以被视为是size_t类型的带符号版本。
/*参数：
    -fd:文件描述符，通过open函数得到
    -buf：需要读取的数据存放的地方，数组的地址（传出参数）
    -count：指定的数组的大小
返回值：
    如果成功，返回读取的比特数，返回0表示文件已经读完，返回-1出错
*/
ssize_t write(int fd,const void *buf,size_t,size_t count)
//在进行写操作时，我们通常不希望修改原始数据源。如果允许对传递给write函数的数据进行修改，则可能会导致一些意外后果，例如破坏原始数据、引发内存泄漏等问题。因此，在设计API时应当尽量避免这种情况出现。
/*参数：
    -buf：往磁盘写入的数据
    -count：要写的数据的实际大小
返回值：
    成功：返回实际写入的字节数，0表示未写入
    失败：-1，errno

下面是一个读写操作的例子

#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<stdio.h>
#include<unistd.h>
int main(){
    //通过open打开
    int srcfd = open("english.txt",O_RDONLY);
    if(srcfd==-1){
        perror("打开失败");
        return -1;
    }
    //复习创建文件
    int dstfd = open("cpy.txt",O_WRONLY|O_CREAT，0664)；
    if(dstfd==-1){
        perror("创建失败");
        return -1;
    }
    //读写操作
    char buf[1024] = {0};//初始化一个“缓冲区”用于读写
    int len = 0;//用来接收ssize的返回值
    while((len = read(srcfd,buf,sizeof(buf))))>0){//成功读取到buf中
        write(dstfd,buf,len);//写入到cpy.txt中
    }
    //关闭文件
    close(srcfd);
    close(dstfd);
    return 0;
}

开始有一个疑惑，每次循环执行read时为什么从上次位置而不是开头？

read函数每次读取完数据后，文件指针都会停留在当前位置。也就是说，在下一次调用read函数时，它将从上一次读取结束的地方开始继续读取。除非用lseek函数定位