基础概念
程序是为完成特定任务、用某种语言编写的一组指令的集合。
-
程序是指一段静态的代码,是一个静态的概念
进程是具有一定独立功能程序的运行过程,是系统进行资源分配和调度的一个独立单位,重点在系统资源调度的单位,也就是说进程是可以独立运行的一段程序。
-
进程是程序的一次执行过程,通常是一个可执行程序在内存中的一个完整副本,每个进程都有自己的数据段、栈段和代码段,是一段完整的程序,在内存中占据较大的空间,是系统进行调度和资源分配的一个独立单位。是一个动态的概念
-
多进程是指操作系统能同时运行多个任务(程序),多线程是指在同一程序中有多个顺序流在执行
线程是进程中的一个独立执行线索,是进程中的一个实体,是CPU调度和分派的基本单位,是比进程更小的能独立运行的基本单位,线程自己基本上不拥有系统资源。在运行时,只是暂用一些计数器、寄存器和栈(栈帧)
-
线程是进程中的一个实体,用来描述进程的执行,它负责执行包括在进程的地址空间中的代码。创建一个进程时,它的第一个线程称为主线程,它由系统自动生成
-
多线程时指同一程序中有多个顺序流在执行
进程
每个进程都有独立的代码和数据空间(进程上下文),进程间的切换会有较大的开销,一个进程包含1--n个线程。进程是资源分配的最小单位
同一类线程共享代码和数据空间,每个线程有独立的运行栈和程序计数器PC,线程切换开销小。线程是cpu调度的最小单位
进程的三大特征
1、独立性:进程是系统中独立存在的实体,它可以拥有自己独立的资源,每个进程都拥有自己私有的地址空间。在没有经过进程本身允许的情况下,一个用户进程不可以直接访问其他进程的地址空间。
2、动态性:进程与程序的区别在于,程序只是一个静态的指令集合,而进程是一个正在系统中活动的指令集合。在进程中加入了时间的概念。进程具有自己的生命周期和各种不同的状态,这些概念在程序中都是不具备的。
3、并发性:多个进程可以在单个处理器上并发执行,多个进程之间不会互相影响。
僵尸进程和孤儿进程
僵尸进程是当子进程比父进程先结束,而父进程又没有回收子进程,释放子进程占用的资源,此时子进程将成为一个僵尸进程。如果父进程先退出 ,子进程被init接管,子进程退出后init会回收其占用的相关资源 ---> 是对系统资源的浪费,必须解决
孤儿进程是一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。---> 没有什么危害
并行与并发
并行:多个cpu实例或者多台机器同时执行一段处理逻辑,是真正的同时。
并发:通过cpu调度算法,让用户看上去同时执行,实际上从cpu操作层面不是真正的同时。并发往往在场景中有公用的资源,那么针对这个公用的资源往往产生瓶颈,我们会用TPS(每秒钟处理的事务数)或者QPS(每秒钟处理的请求数)来反应这个系统的处理能力。
主线程
线程是进程中的一个实体,用来描述进程的执行,它负责执行包括在进程的地址空间中的代码。
创建一个进程时,它的第一个线程称为主线程,它由系统自动生成
它是产生其他子线程的线程
进程和线程的关系就是:一个进程可以包含一个或多个线程,但至少会有一个线程。
操作系统CPU调度的最小任务单位是线程,操作系统资源调度的最小单位是进程。常用的Windows、Linux等操作系统都采用抢占式多任务,如何调度线程完全由操作系统决定,程序自己不能决定什么时候执行,以及执行多长时间
Java语言内置了多线程支持:一个Java程序实际上是一个JVM进程,JVM进程用一个主线程来执行main()方法,在main()方法内部又可以启动多个线程。此外,JVM还有负责垃圾回收的其他工作线程等。
线程和进程的区别
1、调度:线程是CPU调度和分配的基本单位,进程是系统资源分配和调度的基本单位。
2、并发性:不仅进程之间可以并发执行,同一个进程的多个线程之间也可以并发执行,一个进程至少有一个线程(单进程单线程),一个线程必须隶属于某个进程。
3、拥有资源:进程是拥有资源的一个独立单位,线程不拥有系统资源,但可以访问隶属于进程的资源。
进程和线程最大的区别在于:进程是由操作系统来控制的,而线程是由进程来控制的。
线程本身的数据通常只有寄存器数据以及一个程序执行时使用的堆栈,所以线程的切换比进程切换的负担要小。
多个进程的内部数据和状态都是完全独立的,而多线程是共享一块内存空间和一组系统资源,有可能互相影响。