标准C库I/O函数和linux中I/O函数的区别
缓冲区的刷新办法:
--通过fflush函数对缓冲区进行刷新
--缓冲区已满
--正常关闭文件:fclose、return(main函数)、exit(main函数)
用户程序调用C标准I/O库,然后C标准I/O函数调用内核的write、read对磁盘进行操作
因此两者是一个上下级的关系
一般来说,我们认为linux是没有缓冲区的,实际上时有的
Linux的I/O实际上是有缓冲区的,只不过它采用了一种不同于传统操作系统的缓存机制。在Linux中,所有文件都被视为一个流(stream),而这个流可以被分成多个块(block)。每当应用程序请求读取或写入数据时,内核会将数据从磁盘读入到内存中,并将其放置在一个称为页缓存(page cache)的高速缓存中。
与传统操作系统不同之处在于,在Linux中,应用程序并不能直接访问页缓存。相反,它必须通过调用标准I/O库函数来进行读取和写入操作。这些函数会自动管理页缓存,并确保数据正确地从磁盘到达应用程序。
因此,在Linux中虽然没有显式的用户空间输入输出缓冲区,但是内核提供了高效且透明的页缓存机制来优化文件I/O性能。
虚拟地址空间
Linux将整个虚拟地址空间分为两部分:用户空间和内核空间。用户空间用于存储应用程序代码、数据以及堆栈等信息,而内核空间则保留给操作系统使用。
在32位架构下,Linux将4GB的虚拟地址空间划分为两部分:3GB供用户态使用,1GB供内核态使用;而64位架构下,则将128TB的虚拟地址划分为了512TB供用户态使用,剩余部分仍然由内核占据。
![](https://i-blog.csdnimg.cn/blog_migrate/93d41cb1249fe2db9dd7521b46b2455f.png)
文件描述符
在linux中,文件描述符(File Descriptor)是一个用于访问文件或其他输入/输出资源的整数标识符。
每个进程都有一张打开文件的表格,其中存储了该进程所打开的所有文件及其相关信息。而这些打开的文件都会被分配一个唯一的数字标识符,即为“文件描述符”。
通常情况下,0、1和2分别代表标准输入、标准输出和标准错误输出。当程序需要读取数据时,它将从stdin(即0号描述符)中读取;当程序需要向屏幕上显示消息时,则会使用stdout(即1号描述符)。如果发生错误,则可以将错误信息写入stderr(即2号描述符)。
![](https://i-blog.csdnimg.cn/blog_migrate/1d53fdb86b31bb4df33f2f93918b5138.png)
open函数读写现有文件
linux的open函数有两个重载形式
int open(const char* pathname,int flags);
int open(const char* pathname,int flags,mode_t mode);
参数:
-pathname是文件的路径
-flags是操作权限和其他设置:三个必选项是O_RDONLY,O_WRONLY,O_RDWR,分别表示仅可读、仅可写和允许读写,flags是一个32位的参数,每一位就是一个标志位,因此多条件需要用或
-mode是一个8进制的数,表示用户对新创建文件的操作权限
返回值:
-返回一个新的文件描述符或者-1(错误)
open函数需要一些头文件
#include<sys/types.h>
#include<sys/stat.h>
//flags定义在前两个头文件中
#include<fcntl.h>
//open函数在这里定义
针对打开失败出现的错误,我们也有函数进行输出
errno:属于linux的系统函数库,是库里面的一个全局变量,记录的是最近的错误号
#include<stdio.h>
void perror(const char *s)//s为用户自己定义的错误描述
该函数的作用是打印errno对应的错误描述
输出格式:
"s:标准错误原因"
针对第一个open函数,我们可以写出以下的代码
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<stdio.h>
#include<unistd.h>
int main(){
//打开文件
int fd = open("a.txt",O_RDONLY);//返回一个文件描述符用fd接收
if(fd == -1){//打开失败
perror("open失败");
}
//读写操作
//关闭
close(fd);
//close函数的头文件是unistd.h
return 0;
}
在上述代码中,如果a.txt不存在,open函数返回-1。perror函数输出
"open失败:No such file or directory"
5.open函数创建文件
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<stdio.h>
#include<unistd.h>
int main(){
//创建新文件
int fd = open("create.txt",O_RDWR|O_CREAT,0777);
if(fd == -1){
perror("创建失败");
close(fd);
return 0;
}
解释一下0777的意义
我们在终端中输入ll后可以看到
-rwxrwxrwx三个一组,分别表示当前用户、当前用户所在组和其他用户所在组的权限
0777 = 111 111 111 ,0代表8进制,对应着rwx权限
-x表示可执行(Execute)
最终的结果是 mode & ~umask
不同用户的umask掩码不同,作用是抹去某些权限
由于umask值为0002,因此会从777这个初始值中减去002得到775作为实际使用值。
umask的作用是抹去某些权限
write和read函数
#include<unistd.h>
ssize_t read(int fd,void *buf,size_t count)
//ssize_t是一种有符号整数类型,通常用于表示读取或写入操作的字节数。它可以被视为是size_t类型的带符号版本。
/*参数:
-fd:文件描述符,通过open函数得到
-buf:需要读取的数据存放的地方,数组的地址(传出参数)
-count:指定的数组的大小
返回值:
如果成功,返回读取的比特数,返回0表示文件已经读完,返回-1出错
*/
ssize_t write(int fd,const void *buf,size_t,size_t count)
//在进行写操作时,我们通常不希望修改原始数据源。如果允许对传递给write函数的数据进行修改,则可能会导致一些意外后果,例如破坏原始数据、引发内存泄漏等问题。因此,在设计API时应当尽量避免这种情况出现。
/*参数:
-buf:往磁盘写入的数据
-count:要写的数据的实际大小
返回值:
成功:返回实际写入的字节数,0表示未写入
失败:-1,errno
下面是一个读写操作的例子
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<stdio.h>
#include<unistd.h>
int main(){
//通过open打开
int srcfd = open("english.txt",O_RDONLY);
if(srcfd==-1){
perror("打开失败");
return -1;
}
//复习创建文件
int dstfd = open("cpy.txt",O_WRONLY|O_CREAT,0664);
if(dstfd==-1){
perror("创建失败");
return -1;
}
//读写操作
char buf[1024] = {0};//初始化一个“缓冲区”用于读写
int len = 0;//用来接收ssize的返回值
while((len = read(srcfd,buf,sizeof(buf))))>0){//成功读取到buf中
write(dstfd,buf,len);//写入到cpy.txt中
}
//关闭文件
close(srcfd);
close(dstfd);
return 0;
}
开始有一个疑惑,每次循环执行read时为什么从上次位置而不是开头?
read函数每次读取完数据后,文件指针都会停留在当前位置。也就是说,在下一次调用read函数时,它将从上一次读取结束的地方开始继续读取。除非用lseek函数定位