Linux进程和线程深度学习解析
在这里插入代码片最近在面试的时候被问到:什么是进程和线程,他们区别是什么?除了内存空间还有其他不同么?进程号?发现自己了解还是很欠缺。决定重新对这两个概念进行深度学习和理解
学习前疑问:
①什么是进程,什么是线程,具体区别是什么,导致线程出现的原因,携程是什么?
②每个os上的对进程和线程的定义是否一样,是否有区别,有点分别为什么?虚拟化设备的进程是否一样,java和c的进程在运行中是否有区别?
③设计原理,主要针对linux内核设计
④是否可以优化,或者有什么缺点
每个在看这个博客前可以自己想想,看看和我理解的进程和线程是否相同,如果有什么不同观点,请一起讨论学习
一、什么是进程和线程
进程的定义
进程是60年代初首先由麻省理工学院的MULTICS系统和IBM公司的CTSS/360系统引入的。进程是一个具有独立功能的程序关于某个数据集合的一次运行活动。它可以申请和拥有系统资源,是一个动态的概念,是一个活动的实体。它不只是程序的代码,还包括当前的活动,通过程序计数器的值和处理寄存器的内容来表示。
进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。在早期面向进程设计的计算机结构中,进程是程序的基本执行实体;在当代面向线程设计的计算机结构中,进程是线程的容器。程序是指令、数据及其组织形式的描述,进程是程序的实体。
熟悉进程要清楚一下两个概念:
- 进程是一个实体。有独立的地址空间,包括文本区域,数据区域和堆栈。
- 进程是一个”执行中的程序“。程序是没有生命的实体,只有在处理器赋予生命时,才成为一个活动的实体,它称为进程。
引入原因
从理论角度看,是对正在运行的程序过程的抽象;
从实现角度看,是一种数据结构,目的在于清晰地刻画动态系统的内在规律,有效管理和调度进入计算机系统主存储器运行的程序。
进程的特征
- 动态性:进程的实质是程序在多道程序系统中的一次执行过程,进程是动态产生,动态消亡的。
- 并发性:任何进程都可以同其他进程一起并发执行
- 独立性:进程是一个能独立运行的基本单位,同时也是系统分配资源和调度的独立单位;
- 异步性:由于进程间的相互制约,使进程具有执行的间断性,即进程按各自独立的、不可预知的速度向前推进
- 结构特征:进程由程序、数据和进程控制块三部分组成。
- 多个不同的进程可以包含相同的程序:一个程序在不同的数据集里就构成不同的进程,能得到不同的结果;但是执行过程中,程序不能发生改变。
总结:进程出现代表了一个设备上可以运行不同的程序
线程的定义
线程的出现:在开发时,有个需求“想吃饭,又想洗脚”的需求。但现在发现只能做一个件事,要不就在建立一个进程,进程还需要单独分配内存等,此时并不符合在程序设计的要求,之后就引起了对线程概念的设定。可能对这个比喻不太形象。
线程需求特征
- 对线程的建立和销毁要比进程更快
- 可以为cpu的调度,所以在多核cpu中可以真正被并行执行,每个cpu可以调用一个线程
- 可以符合对各种不用需求的实现
线程特点
- 轻量实体
- 线程中的实体基本上不拥有系统资源,只是有一点必不可少的、能保证独立运行的资源。
- 线程的实体包括程序、数据和TCB。线程是动态概念,它的动态特性由线程控制块TCB(Thread Control Block)描述。
-
独立调度和分派的最小单位
在多线程OS中,线程是能独立运行的基本单位,因而也是独立调度和分派的基本单位。由于线程很“轻”,故线程的切换非常迅速且开销小(在同一进程中的)。 -
可并发执行
在一个进程中的多个线程之间,可以并发执行,甚至允许在一个进程中所有线程都能并发执行;同样,不同进程中的线程也能并发执行,充分利用和发挥了处理机与外围设备并行工作的能力。 -
共享进程资源
在同一进程中的各个线程,都可以共享该进程所拥有的资源,这首先表现在:所有线程都具有相同的地址空间(进程的地址空间),这意味着,线程可以访问该地址空间的每一个虚地址;此外,还可以访问进程所拥有的已打开文件、定时器、信号量机构等。由于同一个进程内的线程共享内存和文件,所以线程之间互相通信不必调用内核。
补充
协程是一种用户态的轻量级线程,协程的调度完全由用户控制。协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文的切换非常快。协程只能调用非阻塞接口,当调用阻塞接口时,整个线程都被阻塞,(线程中实现协程 常用的两个API则是setjump,保存当前的堆栈,longjump跳转到指定的位置)
协程与线程进行比较:
- 一个线程可以多个协程,一个进程也可以单独拥有多个协程
- 线程进程都是同步机制,而协程则是异步
- 协程能保留上一次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态
二.进程和线程的区别总结
主要记住-根本:进程是资源分配的最小单位,线程是CPU调度的最小单位
我看过较好的解析;
https://my.oschina.net/cnyinlinux/blog/367910
三.linux 进程实现原理
(待补充)
四.linux 进程设计原理
(待补充)
五.linux 进程优化设计
(待补充)
六.问题解答
(待补充)
下期准备linux进程或线程调度学习