并发编程（三）—— 线程编程、同步互斥（线程锁）、GIL

最新推荐文章于 2021-06-21 13:40:25 发布

酷酷的橙007

最新推荐文章于 2021-06-21 13:40:25 发布

阅读量192

点赞数

分类专栏：多任务并发编程文章标签：线程同步互斥

本文链接：https://blog.csdn.net/xiecheng1995/article/details/104761509

版权

多任务并发编程专栏收录该内容

4 篇文章 0 订阅

订阅专栏

线程编程（Thread）

线程基本概念

什么是线程
【1】线程被称为轻量级的进程
【2】线程也可以使用计算机多核资源，是多任务编程方式
【3】线程是系统分配内核的最小单元（有可能多个线程占用多个内核）
【4】线程可以理解为进程的分支任务
线程特征
【1】一个进程中可以包含多个线程
【2】线程也是一个运行行为，消耗计算机资源
【3】一个进程中的所有线程共享这个进程的资源
【4】多个线程之间的运行互不影响各自运行
【5】线程的创建和销毁消耗资源远小于进程
【6】各个线程也有自己的ID等特征

threading模块创建线程

【1】创建线程对象

from threading import Thread 

t = Thread()
功能：创建线程对象
参数：target 绑定线程函数
　　　args 元组 给线程函数位置传参
　　　kwargs 字典 给线程函数键值传参

【2】启动线程

t.start()

【3】回收线程

t.join([timeout])

单线程（无参数）：

from threading import Thread
from time import sleep
import os

a=1
def music():
	global a
	print("a=",a)# 1
    a = 10000
    for i in range(5):
        sleep(2)
        print(os.getpid(),"播放心如止水")

# 创建线程对象
t = Thread(target=music)
t.start()

# 主线程任务
for i in range(3):
    sleep(3)
    print(os.getpid(),"播放跳舞吧")

t.join()  # 回收进程

# 同一进程，分支线程将变量值更改，主线程变量值也随之更改(区分多进程，两个进程间互不影响)
print("Main thread a:",a)#10000

多线程（有参数）：

from threading import Thread
from time import sleep

# 含有参数的线程函数
def fun(sec, name):
    print("线程函数传参")
    sleep(sec)
    print("%s 线程执行完毕" % name)

# 创建多个线程
jobs = []
for i in range(5):
    t = Thread(target=fun, args=(2,),
               kwargs={'name': 'T%d' % i})
    jobs.append(t)
    t.start()

for i in jobs:
    i.join()

线程对象属性

t.name 线程名称
t.setName() 设置线程名称
t.getName() 获取线程名称

t.is_alive() 查看线程是否在生命周期

t.daemon 设置主线程和分支线程的退出关系
t.setDaemon() 设置daemon属性值
t.isDaemon() 查看daemon属性值
*daemon为True时主线程退出分支线程也退出。要在start前设置，通常不和join一起使用

from threading import Thread
from time import sleep

def fun():
    sleep(3)
    print("线程属性测试")

t = Thread(target=fun, name="Tarena")

# 主线程退出分支线程也退出
t.setDaemon(True)

t.start()

t.setName("Tedu")
print("Name:", t.getName())  # 线程名称（默认Thread-1）
print("Alive:", t.is_alive())  # 线程生命周期
print("is Daemon", t.isDaemon())

自定义线程类

创建步骤
【1】继承Thread类
【2】重写__init__方法添加自己的属性，使用super加载父类属性
【3】重写run方法
使用方法
【1】实例化对象
【2】调用start自动执行run方法
【3】调用join回收线程

重点代码：

from threading import Thread

class ThreadClass(Thread):
    def __init__(self, attr):
        self.attr = attr
        super().__init__()  # 调用父类的init方法

    def f1(self):
        print("步骤1", self.attr)

    def f2(self):
        print("步骤2")

    # 父类方法重写
    def run(self):
        self.f1()
        self.f2()

t = ThreadClass('XXXXX')
t.start()  # 自动运行run方法
t.join()

小练习：

from threading import Thread
from time import sleep, ctime

class MyThread(Thread):
	# pass
    # 解答如下：
    def __init__(self, target=None, args=(),
                 kwargs={}, name="AAA"):
        super().__init__()
        self.target = target
        self.args = args
        self.kwargs = kwargs
        self.name = name

    def run(self):
        self.target(*self.args, **self.kwargs)

# **********************************
# 通过完成上面的MyThread类让整个程序可以正常执行
# 当调用start时player作为一个线程功能函数运行
# 注意：函数名称和参数并不确定，player只是测试函数
# **********************************

def player(sec, song):
    for i in range(2):
        print("Playing %s:%s" % (song, ctime()))
        sleep(sec)

t = MyThread(target=player, args=(3,),
             kwargs={'song': '凉凉'}, name='happy')

t.start()
t.join()

同步互斥

线程间通信方法

通信方法
线程间使用全局变量进行通信。
共享资源争夺

共享资源：多个进程或者线程都可以操作的资源称为共享资源。对共享资源的操作代码段称为临界区。
影响：对共享资源的无序操作可能会带来数据的混乱，或者操作错误。此时往往需要同步互斥机制协调操作顺序。

同步互斥机制
同步：同步是一种协作关系，为完成操作，多进程或者线程间形成一种协调，按照必要的步骤有序执行操作。

互斥：互斥是一种制约关系，当一个进程或者线程占有资源时会进行加锁处理，此时其他进程线程就无法操作该资源，直到解锁后才能操作。

线程同步互斥方法

线程Event

from threading import Event

e = Event()  创建线程event对象

e.wait([timeout])  阻塞等待e被set

e.set()  设置e，使wait结束阻塞(没有这句话e.wait()一直堵塞)

e.clear() 使e回到未被设置状态

e.is_set()  查看当前e是否被设置

重点代码：

from threading import Thread, Event

s = None  # 全局变量用于通信
e = Event()

def yang():
    print("杨子荣前来拜山头")
    global s
    s = "天王盖地虎"
    e.set()  # 共享资源操作完毕

t = Thread(target=yang)
t.start()
print("说对口令就是自己人")

e.wait()  # 堵塞等待
if s == "天王盖地虎":
    print("宝塔镇河妖")
    print("确认过眼神，你是对的人")
else:
    print("打死他。。。")

t.join()

线程锁 Lock

from  threading import Lock

lock = Lock()  创建锁对象
lock.acquire() 上锁  如果lock已经上锁再调用会阻塞
lock.release() 解锁

with  lock:  上锁
...
...
	 with代码块结束自动解锁

重点代码：

from threading import Thread, Lock

a = b = 0
lock = Lock()

def value():
    while True:
        lock.acquire()  # 上锁
        if a != b:
            print("a=%d,b=%d" % (a, b))
        lock.release()  # 解锁

t = Thread(target=value)
t.start()
while True:
    with lock:
        a += 1
        b += 1
t.join()

死锁及其处理

定义

死锁是指两个或两个以上的线程在执行过程中，由于竞争资源或者由于彼此通信而造成的一种阻塞的现象，若无外力作用，它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁。
在这里插入图片描述
2. 死锁产生条件

死锁发生的必要条件：

互斥条件：指线程对所分配到的资源进行排它性使用，即在一段时间内某资源只由一个进程占用。如果此时还有其它进程请求资源，则请求者只能等待，直至占有资源的进程用毕释放。
请求和保持条件：指线程已经保持至少一个资源，但又提出了新的资源请求，而该资源已被其它进程占有，此时请求线程阻塞，但又对自己已获得的其它资源保持不放。
不剥夺条件：指线程已获得的资源，在未使用完之前，不能被剥夺，只能在使用完时由自己释放,通常CPU内存资源是可以被系统强行调配剥夺的。
环路等待条件：指在发生死锁时，必然存在一个线程——资源的环形链，即进程集合{T0，T1，T2，···，Tn}中的T0正在等待一个T1占用的资源；T1正在等待T2占用的资源，……，Tn正在等待已被T0占用的资源。

死锁的产生原因：

简单来说造成死锁的原因可以概括成三句话：

当前线程拥有其他线程需要的资源
当前线程等待其他线程已拥有的资源
都不放弃自己拥有的资源

如何避免死锁

死锁是我们非常不愿意看到的一种现象，我们要尽可能避免死锁的情况发生。通过设置某些限制条件，去破坏产生死锁的四个必要条件中的一个或者几个，来预防发生死锁。预防死锁是一种较易实现的方法。但是由于所施加的限制条件往往太严格，可能会导致系统资源利用率。

使用定时锁
使用重载锁RLock()，用法同Lock。RLock内部维护着一个Lock和一个counter变量，counter记录了acquire的次数，从而使得资源可以被多次acquire。直到一个线程所有的acquire都被release，其他的线程才能获得资源。

使用定时锁：

import time
import threading

# 交易类
class Account:
    def __init__(self, _id, balance, lock):
        self.id = _id  # 用户
        self.balance = balance  # 存款
        self.lock = lock  # 锁

    # 取钱
    def withdraw(self, amount):
        self.balance -= amount

    # 存钱
    def deposit(self, amount):
        self.balance += amount

    # 查看余额
    def get_balance(self):
        return self.balance

# 创建账户
Tom = Account('Tom', 5000, threading.Lock())
Alex = Account('Alex', 8000, threading.Lock())


# 转账函数
def transfer(from_, to, amount):
    if from_.lock.acquire():  # 锁自己账户
        from_.withdraw(amount)  # 自己账户减少
        time.sleep(0.5)  # 产生死锁（因为from和to同时上锁）
        if to.lock.acquire():  # 对方账户上锁
            to.deposit(amount)
            to.lock.release()  # 对方账户解锁
        from_.lock.release()  # 自己账户解锁
    print("%s 给 %s转账完成" % (from_.id, to.id))

t1 = threading.Thread(target=transfer,
                      args=(Tom, Alex, 2000))
t2 = threading.Thread(target=transfer,
                      args=(Alex, Tom, 2000))
t1.start()
time.sleep(2)  # t2等待一段时间再上锁，确保t1先执行完
t2.start()
t1.join()
t2.join()

print("Tom:", Tom.get_balance())
print("Alex:", Alex.get_balance())

使用重载锁RLock()：

from threading import Thread, RLock
import time

num = 0  # 共享资源
lock = RLock()  # 在一个线程内可以对锁进行重复加锁

class MyThread(Thread):
    def fun1(self):
        global num
        with lock:
            num -= 1

    def fun2(self):
        global num
        if lock.acquire():
            num += 1
            if num > 5:
                self.fun1()
            print("Num=", num)
            lock.release()

    def run(self):
        while True:
            time.sleep(2)
            self.fun2()

t = MyThread()
t.start()
t.join()

Python线程GIL

简单来说，就是利用python实现线程的效率低

python线程的GIL问题（全局解释器锁）

什么是GIL ：由于python解释器设计中加入了解释器锁，导致python解释器同一时刻只能解释执行一个线程，大大降低了线程的执行效率。
导致后果：因为遇到阻塞时线程会主动让出解释器，去解释其他线程。所以python多线程在执行多阻塞高延迟IO时可以提升程序效率，其他情况并不能对效率有所提升。

GIL问题建议：

尽量使用进程完成无阻塞的并发行为
不使用c作为解释器（Java C#）

结论：在无阻塞状态下，多线程程序和单线程程序执行效率几乎差不多，甚至还不如单线程效率。但是多进程运行相同内容却可以有明显的效率提升。

作业：编写程序完成效率测试

使用单线程执行计算密集函数十次记录时间，执行IO密集函数十次记录时间
使用10个线程分别执行计算密集函数1次记录时间，执行IO密集函数1次记录时间
使用10个进程分别执行计算密集函数1次记录时间，执行IO密集函数1次记录时间

计算密集型函数：

def count(x,y):
	c = 0
	while c < 7000000:
		c += 1
		x += 1
		y += 1

IO密集型函数：

def io():
	write()
	read()

def write():
	f = open('test','w')
	for i in range(1500000):
		f.write("hello world\n")
	f.close()

def read():
	f = open('test')
	lines = f.readlines()
	f.close()

【单线程】计算密集函数十次：8.780869245529175；IO密集型函数十次：4.685685396194458
【多线程】计算密集函数十次：14.451507091522217；IO密集型函数十次：6.815863847732544
【多进程】计算密集函数十次：4.909349203109741；IO密集型函数十次：2.378950357437134

测试代码

进程线程的区别联系

区别联系

两者都是多任务编程方式，都能使用计算机多核资源
进程的创建删除消耗的计算机资源比线程多
进程空间独立，数据互不干扰，有专门通信方法；线程使用全局变量通信
一个进程可以有多个分支线程，两者有包含关系
多个线程共享进程资源，在共享资源操作时往往需要同步互斥处理
进程线程在系统中都有自己的特有属性标志，如ID,代码段，命令集等。

使用场景

任务场景：如果是相对独立的任务模块，可能使用多进程，如果是多个分支共同形成一个整体任务可能用多线程。
项目结构：多种编程语言实现不同任务模块，可能是多进程，或者前后端分离应该各自为一个进程。
难易程度：通信难度，数据处理的复杂度来判断用进程间通信还是同步互斥方法。

要求

对进程线程怎么理解/说说进程线程的差异
进程间通信知道哪些，有什么特点
什么是同步互斥，你什么情况下使用，怎么用
给一个情形，说说用进程还是线程，为什么
问一些概念，僵尸进程的处理，GIL问题，进程状态

酷酷的橙007

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
并发编程（三）—— 线程编程、同步互斥（线程锁）、GIL

目录线程编程（Thread）线程基本概念threading模块创建线程线程对象属性自定义线程类线程编程（Thread）线程基本概念什么是线程【1】线程被称为轻量级的进程【2】线程也可以使用计算机多核资源，是多任务编程方式【3】线程是系统分配内核的最小单元（有可能多个线程占用多个内核）【4】线程可以理解为进程的分支任务线程特征【1】一个进程中可以包含多个线程【2】线程也是一个...
复制链接

扫一扫