一.了解进程
★了解线程,必须要先知道进程的概念
(上一篇文章已经重点介绍了进程,可自行查看)
(1)进程的概念
进程简单来说就是正在运行的程序,每个进程都有一个独立的内存空间
(2)进程的缺点
虽然多进程本身已经可以完成并发编程(并发编程是指在一台处理器上“同时”处理多个任务),但是进程比较“重”,它创建和销毁的开销大(这里的开销指的是申请和释放资源),因此,我们需要引入线程
二:了解线程
(1)线程的概念
①线程就是负责进程中程序的执行,简单来说就是去完成任务(把进程理解为公司,线程理解为公司的员工,就是线程[员工]去帮进程[公司]执行和完成任务)
②线程可以理解为“轻量级的进程”
问:那线程为什么会比进程更轻量化?
答:因为在创建进程的时候,会把各种硬件(内存、硬盘)资源先分配好;后续创建的线程,让这些线程去共同复用进程之前分配好的各种资源,因此,线程也能够完成“并发编程”,同时它也比进程更加轻量化!
(2)线程调度
指按照特定机制为多个线程分配CPU的使用权
(计算机通常只有一个CPU,在任意时刻只能执行一条机器指令,每个线程只有获得CPU的使用权才能执行指令。所谓多线程的并发运行,其实是指从宏观上看,各个线程轮流获得CPU的使用权,分别执行各自的任务)
★注意:
同一个进程中的这些线程是共用一份内存/硬盘资源,但是这些线程都是独立去CPU调度的,因此每个线程的状态/优先级/上下文/记账信息都是不一样的,我们就可以得出以下结论
★结论:
线程是系统调度执行的基本单位!!!
三:关于PCB
①Windows系统:描述进程和线程的结构体是不一样的
②Linux系统:描述进程和线程的结构体是一样的,都叫PCB
因此,我们通常会说:
一个PCB对应一个线程,多个PCB对应一个进程!
四:进程和线程的区别与联系(面试)
(1)联系
进程包含线程,一个进程既可以包含一个线程,也可以包含多个线程
(当一个进程包含一个线程时,这个线程就叫做主线程)
(2)区别
①开销轻重区别
进程和线程都是为了实现“并发式编程”的方式,但是线程比进程更加的轻量化
②基本单位区别
进程是系统分配硬件资源的基本单位
线程是系统调度的基本单位
③内存空间区别
进程:进程有自己独立的内存地址空间,彼此之间不会受影响
体现了进程的独立性,也体现了进程更有利于系统的稳定性
线程:多个线程共用一份地址空间,线程彼此之间会受影响
一旦某个进程抛出异常,就会导致整个进程异常结束
④资源使用角度
进程:进程之间不能共享资源
线程:进程中的线程之间共享进程的所有资源
五:多线程
(1)优点
①多个线程轮流使用CPU,充分利用了CPU资源的利用率
②多线程处理可以同时运行多个线程,能够提高程序的效率
③在一个程序中,有很多的操作是非常耗时的,如数据库读写操作,IO操作等,如果使用单线程,那么程序就必须等待这些操作执行完成之后才能执行其他操作。使用多线程,可以在将耗时任务放在后台继续执行的同时,同时执行其他操作
(2)缺点
①线程并非越多越好,随着线程数量的增加,整体的效率确实可以提高;但是CPU的逻辑核心数是固定的,一旦超过这个数,此时效率也就无法提高
★线程太多时,线程调度的开销反而会降低效率!!!
②线程也是程序,所以线程需要占用内存,线程越多占用内存也越多
③由于线程是共用同一个内存地址空间,当一个线程有问题可能会影响整个进程,因此多线程之间容易出现BUG,我们也把它称为“线程安全问题”
六:如何更好的节省开销
(1)引出问题
★线程虽然轻量,但也不是没有创建成本,在互联网圈子里,高并发的服务器要处理的并发量太多了,非常频繁的创建线程/销毁线程,开销仍然不可忽视,那么针对这种情况,有没有更好的节省办法?
(2)轻量级线程
①轻量级线程也可以称作协程/纤程
(指的是可以在某个地方挂起的特殊函数,并且可以重新在挂起处继续运行)
②在Java标准库里还没有内置,但有一些第三方库实现了协程
③相比于Java之下,Google里的编程语言Go是天然支持协程的
(3)线程池
将一些要释放的资源,不要着急释放,而是先放到一个“池子”里,以备后续使用
申请资源的时候,也先提前把申请的资源申请好,也放到一个“池子”里,后续申请时也方便