一、系统调用
- UNIX / Linux系统绝大部分功能都是通过系统调用实现,如:open / close …
- UNIX / Linux把系统调用都封装成了C函数的形式,但他们并不是标准C的一部分。
- 标准库中的函数绝大部分时间都工作在用户态,但部分时间也需要切换到内核(进行了系统调用),比如:fread / fwrite / malloc / free.
- 我们自己所编写的代码也可以直接调用系统接口进入内核态(进行系统调用),比如:brk / sbrk / mmap / munmap
- 系统调用的功能代码存在于内存中,接口定义在C库中,该接口通过系统中断实现调用,而不是普通函数进行跳转。
time ./a.out | 注意 | 从用户态切换到内核态或者从内核态返回到用户态,都会消耗时间 |
---|---|---|
real | 0m0.137s | 总执行时间=用户态+内核态+切换消耗 |
user | 0m0.092s | 用户态执行时间 |
sys | 0m0.040s | 内核态执行时间 |
strace ./a.out | 程序 | 可以跟踪系统调用 |
二、一切皆文件
在UNIX / Linux系统下,几乎所有资源都是以文件形式提供了,所以在NUIX / Linux系统下一切皆文件,操作系统把它的服务、功能、设备抽象成简单的文件,提供一套简单统一的接口,这样程序就可以像访问磁盘上的文件一样访问串口、终端、打印机、网络等功能。
大多数情况下只需要 open / read / write / ioctl / close 就可以实现对各种设备的输入、输出、设置、控制等。
UNIX / Linux下几乎任何对象都可以当作特殊类型的文件,可以以文件的形式访问。
目标文件 | 里面记录的是一些文件信息,相关条目 | |
---|---|---|
设备文件 | 在系统的/dev 目录下存储了所有的设置文件 | stserr / stdin / stdout |
普通文件 | 链接文件、管道文件。socket文件 |
三、文件相关系统调用
open | 打开或创建文件 |
---|---|
creat | 创建文件 |
close | 关闭文件 |
read | 读文件 |
write | 写文件 |
lseek | 设置文件读写位置 |
unlink | 删除硬链接 |
remove | 删除文件 |
四、文件描述符
文件描述符是一个非负整数,表示一个打开的文件,由系统调用open / creat / socket 返回值
为什么使用文件描述符而不像标准库那使用文件指针?
因为记录文件相关信息的结构存储在内核中,为了不暴露内存的地址,因此文件结构指针不能直接给用户操作,内核中记录一张表,其中一列是文件描述符对应一列文件结构指针,文件描述符就相当于获取文件结构指针的下标。
内核中已经有三个已经打开的文件描述符,他们的宏定义在#include <unistd.h>
:
stdin | 0 | STDIN_FILENO |
---|---|---|
stdout | 1 | STDOUT_FILENO |
stderr | 2 | STDERR_FILENO |
0,1,2 都代表的是终端
五、open / creat / close
#include <sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
int open(const char* pathname, int flags);
功能:打开文件
pathname:文件的路径
flags:打开的权限
- O_RDONLY 只读
- O_WRONLY 只写
- O_RDWR 读写
- O_NOCTTY 当打开的终端设备文件,不要把该文件当作主控终端。
- O_TRUNC 清空
- O_APPEND 追加
返回值:文件描述符
int open(const char* pathname, int flags, mode_t mode);
功能:创建文件
pathname:文件的权限
flags:打开的权限
- O_CREAT 文件不存在则创建
- O_EXCL 如果文件存在,则创建失败
mode:设置文件的权限
- S_IRWXU 00700 读写执行权限
- S_IRUSR 00400 读权限
- S_IWUSR 00200 写权限
- S_IXUSR 00100 执行权限
- S_IRWXG 00070 读写执行权限
- S_IRGRP 00040 读权限
- S_IWGRP 00020 写权限
- S_IXGRP 00010 执行权限
- S_IRWXO 00007 读写权限
- S_IROTH 00004 读权限
- S_IWOTH 00002 写权限
- S_IXOTH 00001 执行权限
六、read / write
#include <unistd.h>
ssize_t read(int fd, void *buf, size_t count);
功能:从文件中读取数据到内存
fd:文件描述符,open函数的返回值
buf:数据的存储位置
count:读取的字节数
返回值:成功读取到的字节数
ssize_t write(int fd, const void *buf,size_t count);
功能:把数据写入到文件
fd:文件描述符,open函数的返回值
buf:要写入的数据内存首地址
count:要写入的字节数
返回值:成功写入的字节数
注意:如果把结构体以文本形式写入到文件,需要先把结构体转换成字符串。
七、lseek
off_t lseek(int fd, off_t offset, int whence);
功能:设置文件位置指针
返回值:文件位置指针所在的位置,功能类似ftell
练习1:实现一个Linux系统下的计算文件大小的函数,使用系统调用完成。
#include <stdio.h>
#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <fcntl.h>
size_t file_size(const char* path)
{
int fd = open(path,O_RDONLY);
if(0 > fd)
{
perror("open");
return -1;
}
return lseek(fd,0,SEEK_END);
}
int main()
{
printf("size:%d\n",file_size("dome1.c"));
}
练习2:实现带覆盖检查的cp命令。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <fcntl.h>
int main(int argc,char* argv[])
{
//检查参数是否正确
if(3 != argc)
{
printf("command:cp src desk\n");
return 0;
}
//检查源文件是否存在
int src_fd = open(argv[1],O_RDONLY);
if(0 > src_fd)
{
perror("open");
return -1;
}
//检查目标文件是否存在
int desk_fd = open(argv[2],O_WRONLY|O_CREAT|O_EXCL,0644);
if(0 > desk_fd)
{
printf("目标文件已存在,是否选择覆盖(Y/N)? \n");
char cmd = getchar();
if('y' == cmd || 'Y' == cmd)
{
desk_fd = open(argv[2],O_WRONLY|O_TRUNC);
if(0 > desk_fd)
{
perror("open");
return -1;
}
}
else if('n' == cmd || 'N' == cmd)
{
printf("cp失败\n");
return 0;
}
else
{
printf("输入错误,请重试!\n");
return 0;
}
}
int buf[1024] = {} , ret = 0;
while(ret = read(src_fd,buf,sizeof(buf)))
{
write(desk_fd,buf,ret);
}
close(src_fd);
close(desk_fd);
}
八、dup / dup2
int dup(int oldfd);
功能:复制文件描述符,操作系统会从未使用的文件描述符中选择一个返回。
oldfd:被复制的文件描述符
int dup2(int oldfd,int newfd);
功能:复制指定的文件描述符,如果newfd已经被使用,则先关闭,再复制。
九、标准IO与系统IO比较
练习3:分别使用标准IO与系统IO随机写入1000000个整数到文件,比较哪种更快,为什么?
因为标准IO使用了缓冲技术,当数据写入时,并没有立即把数据交给内核,而是先存放在缓冲区中,当缓冲区满时,会一次性把缓冲区中的数据交给内核写到问价中,这样就减少内核态与用户态的切换次数。
而系统IO每写入一次数据就要进入一次内核态,这样就浪费了大量时间进行内核态和用户态的切换,因此用时更长。
如果为系统IO,设置更大的缓冲区,它会比标准IO运行时间更短。