进程与线程 并且与java相关 生命周期与相关知识的引入
一、进程
一个在内存中运行的应用程序。每个进程都有自己独立的一块内存空间,一个进程可以有多个线程
其特征
动态性:进程的实质是程序在多道程序系统中的一次执行过程,进程是动态产生,动态消亡的。
并发性:任何进程都可以同其他进程一起并发执行
独立性:进程是一个能独立运行的基本单位,同时也是系统分配资源和调度的独立单位;
异步性:由于进程间的相互制约,使进程具有执行的间断性,即进程按各自独立的、不可预知的速度向前推进
结构特征:进程由程序、数据和进程控制块三部分组成。
多个不同的进程可以包含相同的程序:一个程序在不同的数据集里就构成不同的进程,能得到不同的结果;但是执行过程中,程序不能发生改变。
二、线程
进程中的一个执行任务(控制单元),负责当前进程中程序的执行。一个进程至少有一个线程,一个进程可以运行多个线程,多个线程可共享数据。
与进程不同的是同类的多个线程共享进程的堆和方法区资源,但每个线程有自己的程序计数器、虚拟机栈和本地方法栈,所以系统在产生一个线程,或是在各个线程之间作切换工作时,负担要比进程小得多,也正因为如此,线程也被称为轻量级进程。
三、线程和进程区别
理解它们的差别,我从资源使用的角度出发。(所谓的资源就是计算机里的中央处理器,内存,文件,网络等等)
根本区别:进程是操作系统资源分配的基本单位,而线程是任务调度和执行的基本单位
开销方面:每个进程都有独立的代码和数据空间(程序上下文),进程之间切换开销大;线程可以看做轻量级的进程,同一类线程共享代码和数据空间,每个线程都有自己独立的运行栈和程序计数器(PC),线程之间切换的开销小
所处环境:在操作系统中能同时运行多个进程(程序);而在同一个进程(程序)中有多个线程同时执行(通过CPU调度,在每个时间片中只有一个线程执行)
内存分配:系统在运行的时候会为每个进程分配不同的内存空间;而对线程而言,除了CPU外,系统不会为线程分配内存(线程所使用的资源来自其所属进程的资源),线程组之间只能共享资源
包含关系:没有线程的进程可以看做是单线程的,如果一个进程内有多个线程,则执行过程不是一条线的,而是多条线(线程)共同完成的;线程是进程的一部分,所以线程也被称为轻权进程或者轻量级进程
通信方式:线程只能通过共享的存储空间
四、线程的底层实现
其实这两个分类都没有多大的意义,因为liunx都没有TCB 和PCB之分。都是轻量级的线程。再者线程和进程的生命周期大体上相似。所以线程为底层实现,进程为生命周期
线程的底层实现
线程主要是由内核线程(内核线程和用户线程的内核原理小括号)实现的,虽然不常用与开发,但是我们使用一种包装好的接口,也是就是轻量级进程,也就上面所说的线程。详细了解会在我之后的一篇文章里面暂时留着引用小括号()。主要是通过TCB详细内容可以暂时查看(小括号)
万事图为例,下面是流程图
五、进程生命周期
其中PCB主要为进程控制块,主要是存储进程相关的信息,如上下文信息,进程ID和其父ID,虚拟地址和实际物理空间的信息,控制终端消息,工作路径,UMASK掩码等等,之后会通过新的文章进行熟悉暂时留下()可爱的小括号。
PCB1相当于主线程,新线程PCB2、PCB3、PCB4相当于用vfork创建出来的,它们指向同一块地址空间,
它们隶属同一个进程,但是他们有着自己的线程ID
六、多线程和线程安全
尤其记住多线程的情况是讨论同一进程中,但是在统一进程不代表一个业务不会有多个进程参与,就比如分布式情况下,一个进程在他的线程内可能包含的多个业务,而这些业务不可不通过网络通讯,只要是通过网络通讯了,必然是多个进程参与这个业务。
代码线程安全也就意味着多线程场景下的安全问题,多线程下存在并发,并行两种,并发场景下才会产生线程安全问题,并发就是指多线程操作同一资源,并行是指资源互不干涉,这里同一资源操作是指对同一物理地址上的数据,从而导致幻读,脏读等破坏。