1.简介
-
传统的操作系统创建子进程时候,便会给子进程分配对应的内存空间,将所有的资源复制给子进程,这样会导致创建子进程效率低下,不够灵活。
-
Linux系统在创建子进程的设计上采用了写时复制机制(Copy On Write)巧妙的避免了上面的问题。
-
写时复制机制:创建子进程时不复制整个父进程的地址空间,而是共享父进程的地址空间,此时父进程的内存设置为只读模式,当父进程或子进程发生写内存时候,则触发页异常中断,为子进程分配对应的物理页并复制数据(此时其他内存页可能还处于共享状态,只有发生写的内存页被重新分配了),此时父、子进程才各自拥有对应的独立内存。
2.分析
这个写时复制机制现在看起来好像就在系统调用fork创建子进程时起作用,提高创建子进程的效率,提高内存利用率。这样看起来好像这些好处和系统相关,对我们这些应用程序开发者没有太多的影响,是这样的吗? 答案:不是。请往下看。
3.数据持久化应用
在Redis(KV 非关系型)数据库中利用了Linux系统写时复制的机制对数据进行持久化(即存盘)。他的实现机制是主进程正常处理业务逻辑,调用fork创建一个子进程,此时子进程与父进程共享内存地址空间,在子进程中对主进程的内存数据进行写盘,实现持久化数据。
4.写时复制例子
通过一个例子体现写时复制机制,创建一个子进程,打印父子进程写内存前的数据和写内存后的内存数据对比。
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
int main(void)
{
pid_t pid;
char *p_share = (char*)malloc(128);
pid = fork();
sprintf(p_share, "=========%d=======", 10);
if(pid < 0){
perror("create fork err");
return 0;
}else if(pid==0){ /* 子进程 */
printf("[子进程] 前:%s\n", p_share); /* 共享内存空间 */
sprintf(p_share, "=========%d=======", 30); /* 触发页异常中断,重新分配内存 */
printf("[子进程] 后:%s\n", p_share); /* 共享内存空间 */
exit(0);
}else{ /* 父进程 */
printf("[父进程] 前:%s\n", p_share);
wait(NULL); /* 等着子进程结束 */
printf("[父进程] 后:%s\n", p_share);
sprintf(p_share, "=========%d=======", 60);
printf("[父进程] 后后:%s\n", p_share);
}
printf("------finish...\n");
free(p_share);
return 0;
}
运行结果如下图所示。写内存前,父子进程打印内存的数据是一样的,发生写内存时,为子进程分配内存后,更新内存数据,打印的数据不一样了。
5.数据持久化例子
通过上面的COW例子,理解利用COW机制实现数据持久化便很容易,即在子进程中直接将内存数据写入文件保存。
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
int main(void)
{
pid_t pid;
char *p_share = (char*)malloc(128);
pid = fork();
sprintf(p_share, "=========%d=======", 10);
if(pid < 0){
perror("create fork err");
return 0;
}else if(pid==0){ /* 子进程 */
FILE* fp = fopen("save.dat", 'wb');
fwrite(p_share, 1, 128, fp);/* TODO:持久化数据 */
fclose(fp);
exit(0);
}else{ /* 父进程 */
/* TODO: 正常处理主进程业务 */
}
printf("------finish...\n");
free(p_share);
return 0;
}