进程的概念及编程1

进程的概念

       进程是程序的一个执行实例,正在执行的程序。进程的两个基本元素是程序代码(可能被执⾏行相同程序的其他进程共享)和代码相关联的数据集。进程是⼀一种动态描述,但是并不代表所有的进程都在运⾏行。(进程在内存中因策

略或调度需求,会处于各种状态)

内核的观点:担当分配系统资源(CPU时间,内存)的实体。

其中子进程id(PID)  父进程id(PPID)

进程的描述:

广义上进程信息被存放在进程控制块的数据结构中,可以理解成进程的属性集合。那么什么是进程控制块?

进程控制块PCB:每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,Linux内核的进程控制块是task_struct结构体。

保存进程信息的数据结构叫做 task_struct,并且可以在 include/linux/sched.h ⾥里找到它。所有运行在系统⾥里的进程都以 task_struct 链表的形式存在内核⾥里。进程的信息可以通过 /proc 系统文件夹查看。要获取PID400的进程信息,你需要查看 /proc/400 这个⽂件夹。⼤多数进程信息同样可以使⽤用topps这些用户级⼯具来获取。

 

进程的位置:

我们在编译程序的时候要将文件转化成多目标文件,但是如果程序有多个目标文件或程序中使用库函数,则编译器需要将所有文件及所需要的文件链接起来,最后生成可执行程序,然后操作系统将可执行程序复制到内存中。

1.内核将程序读入内存为程序分配内存空间

2.内核为该进程保存PID及相应的状态信息,把进程放到队列中等待执行。程序转化为进程后就可被操作系统的调度程序执行。

进程的内存映像是指内核在内存中如何存放可执⾏行程序文件。在将程序转化为进程的过程中,操作系统将可执行程序从硬盘复制到内存中





3.进程映像的位置依赖于使⽤用的内存管理⽅方案。

4. 可执行程序与进程内存映像的不同之处在于:

a. 可执行程序位于磁盘中而内存映像位于内存;

b. 可执行程序没有堆栈,因为程序被加载到内在中才会分配堆栈;

c. 可执行程序虽然也有未初始化数据段但它并不被存储在位于硬盘中的可执行⽂文件中;

d. 可执行程序是静态的、不变的,而内在映像随着程序的执行是在动态变化的,比如数据段随着程序的执行要存储新的变量值,栈在函数调用时也是不断在变化中。

 

环境变量:

由于父进程在调用fork创建子进程时会把自己的环境变量也复制给子进程,所以a.out打印的环境变量和shell进程的环境变量是相同的,环境变量 = 环境变量的值,大多数环境变量由大写字母加下划线组成,环境变量定义了进程的运行环境。

PATH:

可执行文件的搜索路径。ls命令也是一个程序,执行它不需要提供完整的路径名/bin/ls,然而通常我们执行当前目录下的程序a.out却需要提供完整的路径名./a.out,这是因为PATH环境变量的值里面包含了ls命令所在的目录/bin,却不包含a.out所在的目录。PATH环境变量的值可以包含多个目录,:号隔开。在Shell中⽤用echo命令可以查看这个环境变量的值:

$ echo $PATH

/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games



SHELL:当前SHELL

TERM:当前终端类型

LANG:语言和locale

HOME:当前用户主目录的路径,很多程序需要在主目录下保存配置文件,使得每一个用户在运行该程序时都有自己的一套配置。

libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头⽂件中,所以在使用时 要⽤用extern声明。用environ指针可以查看所有环境变量的字符串,但是不够方便如果给出环境变量名要在环境变量表中查找对应的环境变量值可以用getenv函数,它的返回值是指向value的指针,若未找到则NULL。修改环境变量可以用putenvsetenv函数判断成功则返回0,出错则返回非0

setenv将环境变量name的值设置为value。如果已存在环境变量name,那么

rewrite ⾮非0,则覆盖原来的定义;

rewrite 0,则不覆盖原来的定义,也不返回错误。 unsetenv删除name的定义。即使name没有定义也不返回错误。

 

父进程在创建子进程时会复制一飞环境变量给子进程,但此后二者的环境变量互不影响。

 

进程的状态:

正在运行的进程存在不同的状态。

static const char * const task_state_array[] = {

"R (running)", /* 0 */

"S (sleeping)", /* 1 */

"D (disk sleep)", /* 2 */

"T (stopped)", /* 4 */

"t (tracing stop)", /* 8 */

"X (dead)", /* 16 */

"Z (zombie)", /* 32 */

1.运行状态(running):并不意味着进程一定在运行中,它表明进程要么是在运行要么在运行队列中。

2.睡眠状态(sleping:进程在等待时间完成

3.磁盘休眠状态(Disk sleep:也叫不可中断睡眠状态,在这个状态的进程通常会等待IO的结束。

4.停止进程(T):可以通过发送 SIGSTOP 信号给进程来停⽌止(T)进程。这个被暂停的进程可以通过发送SIGCONT 信号让进程继续运⾏。

   例如,可以⽤用下面的方法来停止或继续运行进程:

   kill -SIGSTOP <pid>

   kill -SIGCONT <pid>

   可以使⽤用gdb终⽌止进程来实现跟踪终⽌止状态

5.死亡状态:内核运行 kernel/exit.c ⾥里的 do_exit() 函数返回的状态。这个状态只是一个返回状态

6.僵死状态(Zombies):是⼀个比较特殊的状态。当进程退出并且父进程(使⽤用wait()系统调用)没有读取到子进程退出的返回代码时就会产生僵死进程。僵死进程会以终止状态保持在进程表中,并且会一直在等待⽗父进程读取退出状态代码。




进程优先级:

进程优先级就是把进程运行到指定CPU上,使进程拥有优先执行的权力,这对于多任务环境的linux环境很有用,可以改善系统性能。

   .系统进程



UID : 代表执⾏行者的⾝身份

PID : 代表这个进程的代号

PPID :代表这个进程是由哪个进程发展衍⽣生⽽而来的,亦即⽗父进程的代号

PRI :代表这个进程可被执⾏行的优先级,其值越⼩小越早被执⾏行

NI :代表这个进程的nice

PRI也还是⽐比较好理解的,即进程的优先级,或者通俗点说就是程序被CPU执⾏的先后顺序,此值越⼩小进程的优先级别越高。

PRI(new)=PRI(old)+nice。这样,当nice值为负值的时候,那么该程序将会优先级值将变

小,即其优先级会变高,则其越快被执行。到目前为止,更需要强调一点的是,进程的nice值不是进程的优先级,他们不是一个概念,但是进程nice值会影响到进程的优先级变化

二.修改进程优先级的俩个命令nice,renice

1.一开始就执行程序指定nice  nice -n -5 /user/local

2.调整已存在进程的nice:renice:  renice -5 -p 5200

3.也可以用top命令更改已存在进程的nice1  top   #进⼊入top后按“r”–>输⼊入进程PID>输⼊入nice

 

进程创建执行:

1.fork创建:要创建一个子进程可以执行fork()系统调用。然后子进程会得到父进程中数据段,栈段和堆区域的一份拷贝。子进程独⽴可以修改这些内存段。但是文本段是父进程和子进程共享的内存段,不能被子进程修改。

2.Execvc:这个系统调用会销毁所有的内存段去重新创建一个新的内存段。然⽽,execve()需要一个可执⾏文件或者脚本作为参数,这和fork()有所不同。注意,execve()fork()创建的进程都是运行进程的子进程。

3.僵尸进程:⼀个子进程在其父进程没有调⽤用wait()waitpid()的情况下退出。这个子进程就僵尸进程。如果其⽗父进程还存在而一直不调⽤用wait,则该僵⼫尸进程将无法回收,等到其父进程退出后该进程将被init回收。

4.孤儿进程:一个父进程退出,而它的一个或多个子进程还在运行,那么那些⼦子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。

 

进程环境:

main()函数:当内核使用一个exec函数执行C程序时,在调用main函数之前调用一个特殊的启动例程,可执行程序将此类程指定为程序的起始地址。启动例程从内核获取命令行参数和环境变量,然后为调用main函数做好准备。

 

进程终止:

1.mian函数返回

2.调用exit函数

3.调用_exit_Exit

4.最后一个线程从启动例程返回

5.最后一个线程调用pthread_exit;

6.调用abort函数(异常终止)

7.接到一个信号并终止(异常终止)

8.最后一个线程对取消请求做出响应(异常终止)

(1)exit函数

#include <stdlib.h>

void exit( int status );

void _Exit( int status );

#include <unistd.h>

void _exit( int status );

这三个函数用于正常终止一个程序,_exit_Exit立即进入内核,而exit则要先做一些清理工作(调用执行各终止处理程序,关闭所有标准I/O流),再进入内核。三个函数所带的整型参数称为终止状态或退出状态,

(2)atexit函数:#include <stdlib.h>  int atexit( void (*fun)( void ) );

     一个进程可以登记若干个函数,这些函数由exit自动调用,这些函数被称为终止处理函数,atexit函数可以登记这些函数。exit调用终止处理函数的顺序和atexit登记的顺序相反,如果一个函数被多次登记,也会被多次调用。

 

环境表:每个程序会收到一张环境表,环境表是一个字符指针数组,每个指针指向一个以’\0’结尾的环境字符串,环境指针environ是一个全局变量,指向指针数组的地址。通常用getenvputenv函数来访问特定的环境变量,而不是environ全局变量如果要查整个环境变量,则必须用environ全局变量。

 

C程序的存储空间布局

正文段:CPU执行的机器指令部分,是共享和只读的。

初始化数据段:又称为数据段,包含了程序中明确需要赋初值的变量。

非初始化数据段:在程序开始执行前,内核将此段中的数据初始化为0或空指针。

栈:自动变量以及每次函数调用时所保存的数据段都存放在此段中。

堆:用于动态存储分配。堆位于栈和非初始化数据段之间。

 

存储器分配:#include <stdlib.h>

void *malloc( size_t size );

void *calloc( size_t nobj, size_t size );

void *realloc( void *ptr, size_t newsize );

void free( void *ptr );

 

malloc函数分配指定字节数的存储区,该存储区中的初始值不确定;calloc函数为指定数量且指定长度的对象分配存储空间,该空间的每一位都初始化为0realloc函数更改存储区的长度,新增加域内的初始值不确定,如果ptr为空,reallocmalloc的功能相同。

但是动态存储分配的存储空间都比所要求的大一些,额外的空间件用来存储管理信息。如果在一个超过已分配的尾端进行操作,就会重写下一个分配区的管理记录;同样,在一个已分配区的起始位置之前写入,会重写下一个分配区的管理记录;同样,在一个已分配区的起始位置之前写入,会重写本分配的管理记录,这种错误是灾难性的,但不会很快暴露出来,所以很难发现。

 

环境变量:环境变量的解释完全取决于各个应用程序,而与内核无关。

 

栈帧

1.堆栈:堆栈是C语言程序运行时必须的一个记录调用路径和参数的空间。用于:函数调用框架,参数传递,保存返回地址,提供局部变量空间。

2.堆栈寄存器和堆栈操作

  堆栈相关的寄存器:esp,堆栈指针,  ebp, 基址地址

  堆栈操作: push 栈顶地址减少4个字节  pop:入栈,栈顶地址增加4个字节。

  ebpC语言中用作记录当前函数调用基址

3.利用堆栈实现函数调用和返回

 其他关键寄存器:cs:eip: 总是指向下一条的指令地址

                 顺序执行:总是指向地址连续的下一条指令

                 跳转/分支:执行这样的指令的时候,cs:eip的值会根据程序需要被修改

                 Call:将当前cs:eip的值压入栈顶,cs:eip指向被调用函数的入口地址

                 ret:从栈顶弹出原来保存在这里的cs:eip的值,放入cs:eip

 

4.C语言中使用堆栈主要进行:参数的传递,局部变量的使用

5.堆和栈的关系:平时所说的堆栈其实是指栈,而实际上堆和栈是俩中不同的内存分配。

(1)堆需要用户在程序中显式申请,栈不用,由系统自动生成。申请/释放堆内存的API,C语言中是malloc/free,C++中是new/delete。申请与释放一定要配对使用,否则会造成内存泄露,久而久之系统就无内存可用了,出现OOM错误就是内存泄露导致的。一般在return/exitbreak/continue等语句时容易忘记释放内训,所以检查内存泄露的代码时要关注这些语句。

(2)堆的空间比较大,栈比较小。所以申请大的内存一般在堆中申请;栈上不要有较大的内存使用,比如打的静态数组;而且除非算法必要否则一般不要使用较深的迭代函数调用,那样栈小时内存会随着迭代次数的增加飞涨。

(3)关于生命周期。栈较短,随着函数退出或返回,本函数的栈就完成了使用;堆就要看什么时候释放,生命周期就什么时候结束。

 



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值