一、在Linux程序中,fork()会产生一个和父进程完全相同的子进程,但子进程在此后大多会exec系统调用,出于效率考虑,linux中引入了“写时复制“技术,也就是只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。
传统的fork()系统调用直接把所有的资源复制给新创建的进程。这种实现过于简单并且效率低下,因为它拷贝的数据也许并不共享,或者,如果新进程打算立即执行一个exec系统调用,那么所有的拷贝都将前功尽弃。
Linux的fork()使用写时拷贝 页实现。写时拷贝是一种可以推迟甚至免除拷贝数据的技术。内核此时并不复制整个进程地址空间,而是让父进程和子进程共享同一个拷贝。
只有在需要写入的时候,数据才会被复制,从而使各个进程拥有各自的拷贝。也就是说,资源的复制只有在需要写入的时候才进行,在此之前,只是以只读方式共享。这种技术使地址空间上的页的拷贝被推迟到实际发生写入的时候。
在页根本不会被写入的情况下—举例来说,fork()后立即调用exec()—它们就无需复制了。
fork()的实际开销就是复制父进程的页表以及给子进程创建惟一的进程描述符。在一般情况下,进程创建后都会马上运行一个可执行的文件,这种优化可以避免拷贝大量根本就不会被使用的数据。
二、STL中的许多类都采用了Copy-On-Write技术: std::string
类的实现就采用了写时才复制技术
Copy-On-Write使用了"引用计数(retainCount)"的机制(在Objective-C和Java中有应用)。
当第一个string对象str1构造时,string的构造函数会根据传入的参数在堆空间上分配内存。
当有其它对象通过str1进行拷贝构造时,str1的引用计数会增加1.
当有对象析构时,这个引用计数会减1。直到最后一个对象析构时,引用计数为0,此时程序才会真正释放这块内存。
即引用计数用来解决用来存放字符串的内存何时释放的问题。
引用计数就是string类中写时拷贝的原理 。