进程、线程与协程详解(基本原理)(一)

进程

进程的定义

进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。
从狭义上说:进程就是正在运行程序的实例。
从广义上说:进程是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元。
进程的概念主要有两点

  • 第一,进程是一个实体。每一个进程都有它自己的地址空间,一般情况下,包括文本区域(text region)、数据区域(data region)和堆栈(stack region)。文本区域存储处理器执行的代码;数据区域存储变量和进程执行期间使用的动态分配的内存;堆栈区域存储着活动过程调用的指令和本地变量。
  • 第二,进程是一个“执行中的程序”。程序是一个没有生命的实体,只有处理器赋予程序生命时(操作系统执行之),它才能成为一个活动的实体,我们称其为进程。

进程之间的通信

进程间通信(IPC,Intel-Poroccess Communication),是指不同进程之间传播或者交换信息。IPC的方式通常有:

  • 管道,包括:有名管道(FIFO)、无名管道(PIPE)、流管道(s_pipe)
    无名管道(PIPE) 是一种半双工(数据只能在一个方向上流动) 的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。
    有名管道 (named pipe) 也是半双工的通信方式,但是它允许无亲缘关系进程间的通信。
  • 信号(signal)
    信号 ( sinal ) : 信号是一种比较复杂的通信方式,用于通知接收进程某个事件已经发生。
  • 消息队列。
    消息队列( message queue ) : 消息队列是由消息的链表,存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。
  • 共享内存。
    共享内存( shared memory ) :共享内存就是映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问。共享内存是最快的 IPC 方式,它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制,如信号两,配合使用,来实现进程间的同步和通信。
  • 信号量。
    信号量( semophore ) : 信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同一进程内不同线程之间的同步手段。
  • 套接字(socket) 。
    套接字( socket ) : 套解口也是一种进程间通信机制,与其他通信机制不同的是,它可用于不同进程及其间的进程通信。
  • Streams。
    Streams,个人理解是一种高级管道,也有人称之为流管道(s_pipe),是一种全双工的管道。PS:者里是个人理解,不一定正确。

进程的基本特征

进程具有四个基本特征:动态性、并发性、独立性与异步性。

  • 动态性是指:进程是程序在操作系统中称执行过程,它是一个动态产生、动态消亡的。
  • 并发性是指:多个程序可以同时执行,即多个程序可以同时产生与消亡
  • 独立性是指:进程是一个独立运行的程序,同时也是系统分配资源与调度的独立单位(基本单位)。
  • 异步性是指:进程之间的相互制约,使进程之间有相互的间断性,进程按自己独立的不可预知的速度向前推进。即一个进程不会干扰其他进程的运行。

进程的状态与转换

进程是动态的、独立的,故进程状态是变化的。进程具有三个基本状态:运行、就绪、阻塞。当然如果更详细一点的划分,在就绪之前还有新建;运行之后还有终止。
如下图所示:
在这里插入图片描述

运行(running):该进程占用了CPU,在CPU上运行中。
就绪(ready):当前进程(程序)具备运行条件,但是没有空闲的CPU给他来用,暂时不可运行。
阻塞(blocked):需要等待某一个事件,当前进程(程序)是不具备运行条件的,即使CPU空闲,也不运行。需要等到某个条件(事件)达成才运行。

进程控制块

进程控制块(Processing Control Block),是操作系统核心中一种数据结构,主要表示进程状态。其作用是使一个在多道程序环境下不能独立运行的程序(含数据),成为一个能独立运行的基本单位或与其它进程并发执行的进程。

进程的由来

fork()创建
创建进程,昂贵,消耗资源
IPC:进程间通信
父进程向子进程传递数据容易,但是子进程向父进程传递数据困难
由于进程创建太过于耗费资源、进程间通信困难,于是就有了线程这一概念。

线程

线程的定义

线程(thread)是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。在Unix System 及SunOS中也被称为轻量进程(lightweight processes),但轻量进程更多指内核线程(kernel thread),而把用户线程(user thread)称为线程。
线程是独立调度和分派的基本单位。线程可以为操作系统内核调度的内核线程,如Win32线程;由用户进程自行调度的用户线程,如Linux平台的POSIX Thread;或者由内核与用户进程,如Windows 7的线程,进行混合调度。
同一进程中的多条线程将共享该进程中的全部系统资源,如虚拟地址空间,文件描述符和信号处理等等。但同一进程中的多个线程有各自的调用栈(call stack),自己的寄存器环境(register context),自己的线程本地存储(thread-local storage)(摘自百度百科)。
一个进程可以有很多线程,每条线程并行执行不同的任务。

线程间的通信

线程间的通信方式-共享变量

  • 如果是各种数据的时候,也可首选使用共享变量而非queue
  • 共享变量的操作并不是线程安全的操作,为了达到预期的效果必须在这些操作上加上一把锁,能够安照预期的效果在线程之间按照顺序进行同步
  • 多进程中共享变量是行不通的
  • 声明一个全局变量,将这个全局变量在各个线程中使用
    通过消息队列进行线程间同步
  • 线程间需要通信,使用全局变量需要加锁。
  • 使用queue模块,可在线程间进行通信,并保证了线程安全。
  • 全局解释器锁 (GIL)

线程特点与属性

在多线程OS中,通常是在一个进程中包括多个线程,每个线程都是作为利用CPU的基本单位,是花费最小开销的实体。
线程具有以下属性:
1)轻型实体
线程中的实体基本上不拥有系统资源,只是有一点必不可少的、能保证独立运行的资源。
线程的实体包括程序、数据和TCB。线程是动态概念,它的动态特性由线程控制块TCB(Thread Control Block)描述。
TCB包括以下信息:

  • 线程状态。
  • 当线程不运行时,被保存的现场资源。
  • 一组执行堆栈。
  • 存放每个线程的局部变量主存区。
  • 访问同一个进程中的主存和其它资源。

2)独立调度和分派的基本单位
在多线程OS中,线程是能独立运行的基本单位,因而也是独立调度和分派的基本单位。由于线程很“轻”,故线程的切换非常迅速且开销小(在同一进程中的)。

3)可并发执行
在一个进程中的多个线程之间,可以并发执行,甚至允许在一个进程中所有线程都能并发执行;同样,不同进程中的线程也能并发执行,充分利用和发挥了处理机与外围设备并行工作的能力。

4)共享进程资源
在同一进程中的各个线程,都可以共享该进程所拥有的资源,这首先表现在:所有线程都具有相同的地址空间(进程的地址空间),这意味着,线程可以访问该地址空间的每一个虚地址;此外,还可以访问进程所拥有的已打开文件、定时器、信号量机构等。由于同一个进程内的线程共享内存和文件,所以线程之间互相通信不必调用内核。

协程

协程是一种用户态的轻量级线程,协程的调度完全由用户控制。协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文的切换非常快。

进程、线程与协程之间关系

进程和线程的关系和区别

1、地址空间:进程内的一个执行单元;进程至少有一个线程;它们共享进程的地址空间;而进程有自己独立的地址空间;因此线程可以读写同样的数据结构和变量,便于线程之间的通信。相反,进程间通信(IPC)很困难且消耗更多资源。
2、资源拥有:进程是资源分配和拥有的单位,同一个进程内的线程共享进程的资源
3、进程是资源的分配和调度的一个独立单元,而线程是CPU调度的基本单元
4、二者均可并发执行.
5、进程的创建调用fork或者vfork,而线程的创建调用pthread_create,进程结束后它拥有的所有线程都将销毁,而线程的结束不会影响同个进程中的其他线程的结束
6、线程有自己的私有属性TCB,线程id,寄存器、硬件上下文,而进程也有自己的私有属性进程控制块PCB,这些私有属性是不被共享的,用来标示一个进程或一个线程的标志。
7、线程是处理器调度的基本单位,进程是操作系统分配与调度资源的基本单位。
8、 每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口,但是线程不能够独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制
9、线程和进程在使用上各有优缺点:线程执行开销小,但不利于资源的管理和保护;而进程正相反。同时,线程适合于在SMP机器上运行,而进程则可以跨机器迁移。

线程与协程

1)一个线程可以多个协程,一个进程也可以单独拥有多个协程。

2)线程进程都是同步机制,而协程则是异步。

3)协程能保留上一次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态。

4)线程是抢占式,而协程是非抢占式的,所以需要用户自己释放使用权来切换到其他协程,因此同一时间其实只有一个协程拥有运行权,相当于单线程的能力。

5)协程并不是取代线程, 而且抽象于线程之上, 线程是被分割的CPU资源, 协程是组织好的代码流程, 协程需要线程来承载运行, 线程是协程的资源, 但协程不会直接使用线程, 协程直接利用的是执行器(Interceptor), 执行器可以关联任意线程或线程池, 可以使当前线程, UI线程, 或新建新程。

6)线程是协程的资源。协程通过Interceptor来间接使用线程这个资源。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值