目录
系统调用——内核提供的函数
1、open函数
函数原型:
int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);
int close(int fd);
open两个参数,路径+打开方式
int open(char *pathname, int flags) 这个函数需要包含这个头文件 #include <unistd.h>
参数:
pathname: 欲打开的文件路径名
flags:文件打开方式: 需要包含下面头文件 #include <fcntl.h>
O_RDONLY|O_WRONLY|O_RDWR O_CREAT|O_APPEND|O_TRUNC|O_EXCL|O_NONBLOCK ....
返回值:
成功: 打开文件所得到对应的 文件描述符(整数)
失败: -1, 设置errno
open两个参数,路径+创建+创建权限
int open(char *pathname, int flags, mode_t mode) 123 775
参数:
pathname: 欲打开的文件路径名
flags:文件打开方式: O_RDONLY|O_WRONLY|O_RDWR O_CREAT|O_APPEND|O_TRUNC|O_EXCL|O_NONBLOCK ....
mode: 参数3使用的前提, 参2指定了 O_CREAT。 取值8进制数,用来描述文件的 访问权限。 rwx 0664
创建文件最终权限 = mode & ~umask
返回值:
成功: 打开文件所得到对应的 文件描述符(整数)
失败: -1, 设置errno
例如
open(“./d.cp”,O_RDONLY | O_CREAT| O_TRUNC, 0644) 如果文件存在那么截断成0,如果文件不存在那么创造文件,并且把文件权限赋值为0644
close函数
int close(int fd);
2、错误处理函数
#include<errno.h>
printf("erron=%d",errno);
通过逻辑条件语句和perror函数结合的错误处理函数
if(fd==-1)
{
perror("打开失败");
exit(1); //打开失败则没必要进行下一步 所以直接退出 或者想执行其他的用break
}
- 打开文件不存在
- 以写方式打开只读文件(打开文件没有对应权限)
- 以只写方式打开目录
#include<errno.h>
printf(“erron=%d”,errno);
3、read函数
ssize_t read(int fd, void *buf, size_t count);
参数:
fd:文件描述符
buf:存数据的缓冲区
count:缓冲区大小
返回值:
0:读到文件末尾。
成功; > 0 读到的字节数。
失败: -1, 设置 errno
-1: 并且 errno = EAGIN 或 EWOULDBLOCK, 说明不是read失败,而是read在以非阻塞方式读一个设备文件(网络文件),并且文件无数据。
4、write函数
ssize_t write(int fd, const void *buf, size_t count);
参数:
fd:文件描述符
buf:待写出数据的缓冲区
count:数据大小
返回值:
成功; 写入的字节数。
失败: -1, 设置 errno
5、缓冲区
系统函数(read、write 函数)常常被称为 Unbuffered I/O。指的是无用户及缓冲区。但不保证不使用内核 缓冲区。
系统函数(read、write)
标库函数(fgetc、fputc)
如果每次读一个字节进行拷贝,比较系统函数和标库函数的效率
对文件进行I/O操作,需要将数据从用户区-> 内核区 ->磁盘,从用户区到内核区需要切换 CPU的访问权级;
系统函数:
每次读取一个字节,切换权级,写入一个字节到内核区,大量时间浪费在切换访问权级上;
库函数:
有用户级缓冲区,ubuntu默认4096字节,当缓冲区满了之后,切换权级,写入内核;
很明显由于后者有缓冲区并不是一个一个字节的写入,因此库函数比较快。
对于两者速度的比较,可以使用strace命令跟踪程序执行,查看调用的系统函数;
系统函数并不一定比库函数运行的快,所以如果有库函数尽量使用库函数。
6、缓冲区
PCB本质是一个结构体,结构体的成员维护这个进程的状态。
text段-代码段
text段存放程序代码,运行前就已经确定(编译时确定),通常为只读。
rodata段(read-only-data)-常量区
rodata段存储常量数据,比如程序中定义为const的全局变量,#define定义的常量,以及诸如“Hello World”的字符串常量。只读数据,存储在ROM中。
注意:
const修饰的全局变量在常量区;const修饰的局部变量只是为了防止修改,没有放入常量区。
编译器会去掉重复的字符串常量,程序的每个字符串常量只有一份。
data段
data存储已经初始化的全局变量,属于静态内存分配。(注意:初始化为0的全局变量还是被保存在BSS段)
static声明的变量也存储在数据段。
bss段
bss段存储没有初值的全局变量或默认为0的全局变量,属于静态内存分配。执行期间必须将bss段内容全部设为0。
stack段-栈
stack段存储参数变量和局部变量,由系统进行申请和释放,属于静态内存分配。
stack的特点是先进后出,可用于保存/恢复调用现场。
heap段-堆
heap段是程序运行过程中被动态分配的内存段,由用户申请和释放(例如malloc和free)。
申请时至少分配虚存,当真正存储数据时才分配物理内存;释放时也不是立即释放物理内存,而是可能被重复利用。
7、阻塞和非阻塞
产生阻塞的场景: 读设备文件、读网络文件。(读常规文件无阻塞概念)
1、读常规文件是不会阻塞的,不管读多少字节,read一定会在有限的时间内返回。
2、从终端设备或网络读写可能会发生阻塞,如果从终端输入的数据没有换行符,调用read读终端设备就会阻塞,如果网络上没有接收到数据包,调用read从网络读就会阻塞,至于会阻塞多长时间也是不确定的,如果一直没有数据到达就一直阻塞在那里。
阻塞(Block)概念
当进程调用一个阻塞的系统函数时,该进程被置于睡眠(Sleep)状态,这时内核调度其它进程运行,直到该进程等待的事件发生了(比如网络上接收到数据包,或者调用sleep指定的睡眠时间到了)它才有可能继续运行。与睡眠状态相对的是运行(Running)状态,在Linux内核中,处于运行状态的进程分为两种情况:
- 正在被调度执行。CPU处于该进程的上下文环境中,程序计数器(eip)里保存着该进程的指令地址,通用寄存器里保存着该进程运算过程的中间结果,正在执行该进程的指令,正在读写该进程的地址空间。
- 就绪状态。该进程不需要等待什么事件发生,随时都可以执行,但CPU暂时还在执行另一个进程,所以该进程在一个就绪队列中等待被内核调度。系统中可能同时有多个就绪的进程,那么该调度谁执行呢?内核的调度算法是基于优先级和时间片的,而且会根据每个进程的运行情况动态调整它的优先级和时间片,让每个进程都能比较公平地得到机会执行,同时要兼顾用户体验,不能让和用户交互的进程响应太慢。
fcntl函数
改变已经打开文件的阻塞和非阻塞的属性
比如如果open时并没有设定非阻塞,但是设备已经打开了,这个时候就可以通过fcntl进行设置
#include <unistd.h>
#include <fcntl.h>
int fcntl(int fd, int cmd, ... /* arg */ );
获取文件状态: cmd写成 F_GETFL,获取文件属性不需要额外参数
int flgs = fcntl(fd, F_GETFL);
返回文件的属性(位图,每一位代表一个属性),用一位表示文件是否阻塞,0 阻塞,1 非阻塞;
设置文件状态: cmd写为 F_SETFL,后面需要跟一个参数 int整数,表示要设置的属性值;
fcntl(fd, F_SETFL, flgs);
返回0;
8、lseek函数
打开文件,默认偏移量被设置为0。
lseek函数是可以改变读写一个文件时读写指针位置一个系统调用。
可以调用lseek显式地为一个打开的文件设置其偏移量
off_t lseek(int fd, off_t offset, int whence);
参数:
fd:文件描述符
offset: 偏移量
whence:起始偏移位置: SEEK_SET/SEEK_CUR/SEEK_END
返回值:
成功:较起始位置偏移量
失败:-1 errno
应用场景:
1. 文件的“读”、“写”使用同一偏移位置。
2. 使用lseek获取文件大小
lseek(fd, 0, SEEK_END)(跳到最后,返回偏移量)
4. 使用lseek拓展文件大小:要想使文件大小真正拓展,必须引起IO操作。
lseek(fd, i, SEEK_END) i为想增长的大小数量,若无IO操作则仍为原大小。
没填东西这些扩展的大小时空洞
可以使用 truncate 函数,直接拓展文件。int ret = truncate("dict.cp", 250);
9、传入传出参数
传入参数:
1. 指针作为函数参数。
2. 同常有const关键字修饰。
3. 指针指向有效区域, 在函数内部做读操作。
传出参数:
1. 指针作为函数参数。
2. 在函数调用之前,指针指向的空间可以无意义,但必须有效。
3. 在函数内部,做写操作。
4。函数调用结束后,充当函数返回值。
通俗就是传一个指针,在内部进行写,可以充当返回值
传入传出参数:
1. 指针作为函数参数。
2. 在函数调用之前,指针指向的空间有实际意义。
3. 在函数内部,先做读操作,后做写操作。
4. 函数调用结束后,充当函数返回值。
传入一个有意义的指针,并且是一个传出参数