Linux进程编程之进程的创建

一、基础概念

1.什么是程序,什么是进程,有什么区别?

程序是一个静态概念,我们用c语言写一个代码,编译器编译之后生成的文件就是一个程序。进程则是一个动态概念,只要程序一旦运行起来了,系统中就多了一个进程,相当于系统多了一个任务。两者区别就在于,一个是静态的,一个是动态的。

2.如何查看系统中有哪些进程?

  • 使用 ps(ps -aux) 指令,配合grep来查找程序中是否存在某一个进程
  • 使用top指令,类似于windows的任务管理器

3.什么是进程标识符?

每个进程都有一个非负整数表示的唯一ID
记:
pid=0,称为交换进程(swapper)
作用:进程调度
pid=1,init进程
作用:系统初始化

进程中调用getpid函数来获取自身的进程标识符,getppid获取父进程
的进程标识符
例如:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int main()
{
    pid_t pid;

    pid = getpid();
    printf("my pid is %d\n",pid);
    while(1);                                                                                                             
    return 0;
}

4.什么是父进程?什么是子进程?

如果进程A创建了进程B,那么进程A就是进程B的父进程,进程B就是进程A的子进程,类似于我们人类的父子关系。

5.C语言的存储空间是如何分配?

BSS段:(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。

数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

代码段: 代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的代码属于只读。在代码段中,字符串常量也属于这部分。

堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。

栈(stack):栈又称堆栈,存放程序的局部变量除此以外,在函数被调用时,栈用来传递参数和返回值等。由于栈的先进后出特点,所以栈特别方便用来保存/恢复调用现场。

下面图来自UNIX环境高级编程书中:
在这里插入图片描述

首先是堆栈区(stack),堆栈是由编译器自动分配释放,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。栈的申请是由系统自动分配,如在函数内部申请一个局部变量 int h,同时判别所申请空间是否小于栈的剩余空间,如若小于的话,在堆栈中为其开辟空间,为程序提供内存,否则将报异常提示栈溢出。

其次是堆(heap),堆一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表。堆的申请是由程序员自己来操作的,在C中使用malloc函数,而C++中使用new运算符,但是堆的申请过程比较复杂:当系统收到程序的申请时,会遍历记录空闲内存地址的链表,以求寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,此处应该注意的是有些情况下,新申请的内存块的首地址记录本次分配的内存块大小,这样在delete尤其是 delete[]时就能正确的释放内存空间。

接着是全局数据区(静态区) (static),全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域,未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。另外文字常量区,常量字符串就是放在这里,程序结束后有系统释放。

最后是程序代码区,放着函数体的二进制代码。

举例说明一下:

int a = 0;                   //全局初始化区
char *p1;                //全局未初始化区 


int main()
{
        int b;                // 栈
        char s[] = "abc";       //栈
        char *p2;             //栈
        char *p3 = "123456";    //123456\0在常量区,而p3在栈上

        static int c =0//全局(静态)初始化区 

        p1 = (char *)malloc(10);

        p2 = (char *)malloc(20); //分配得来得10和20字节的区域就在堆区

        strcpy(p1, "123456");    //123456\0放在常量区,编译器可能会将它与p3所指向的"123456"优化成一个地方。

        return 0;
}
  • 进程地址空间
    一个进程一旦建立,就会自认为占有4G内存(X86_32),这个内存被称作虚拟内存,也就是进程的地址空间。在Linux下,进程地址空间的布局大致如下图所示,其中的用户空间大致由这些部分组成:
    代码段
    初始化数据段
    未初始化数据段


    在这里插入图片描述

这些段,反映到ELF格式的目标文件(object file)中,就又可能由许多不同的节(section)组成。

二、创建进程及进程的运用

1.fork的运用

函数原型:pid_t fork(void)
返回值:子进程的的返回值是0,父进程的返回值则是新建子进程的进程ID,错误返回-1
实例:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int main()
{
    pid_t pid;
    pid = getpid();
    printf("parent process:%d\n",pid);
    
    pid_t pid2 = fork();

    if(pid2 == 0){ 
        printf("this is child process:pid=%d\n",getpid());
    }else if(pid2 > 0){ 
        printf("this is parent process:pid=%d\n",getpid());
    }   
                                                                                                                          

    return 0;
}

2.子进程创建发生了什么?

完全拷贝:在之前的Linux中,创建一个子进程时通常都是,子进程获得父进程的数据空间、堆和栈的副本。注意。这是子进程所拥有的的副本。父进程和子进程并不共享这些存储空间部分,父进程和子进程共享正文段。
写时拷贝:数据段,栈和堆不进行拷贝,而是由父进程和子进程共享,而且内核将它们的访问权限改为只读,如果父进程和子进程中的任一个试图修改这些区域,则内核只为修改区域的那块内存制作一个副本。

3.vfork创建进程

函数原型:pid_t vfork(void);
返回值:子进程的的返回值是0,父进程的返回值则是新建子进程的进程ID,错误返回-1
vfork与fork的区别

  1. vfork不会拷贝父进程的内存空间,而是直接在父进程中的内存空间中运行
  2. vfork保证子进程先运行,在它调用exec或exit之后父进程才可能被调用运行
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值