Liunx系统编程:信号量

一. 信号量概述

1.1 信号量的概念

在多线程场景下,我们经常会提到临界区和临界资源的概念,如果临界区资源同时有多个执行流进入,那么在多线程下就容易引发线程安全问题。

为了保证线程安全,互斥被引入,互斥可以保证在同一时刻只有一个执行流进入临界区访问临界资源,由于整个临界区都只允许一个执行流进入,我们可以认为互斥是将临界区当做一个整体来使用的

但是,如图1.1,假设下面这种场景,一个临界区资源被分为N个小区域,每个小区域都有特定的数据,如果多个执行流同时访问同一个小区域,那么线程之间就会相互干扰,存在线程不安全问题,但如果多个执行流在某一时刻访问不同的小区域,保证每个小区域在同一时刻不会有多个执行流访问,那么即使有多个执行流进入临界区,也不存在线程安全问题。

结论:多个同时进入临界区的执行流,如果不访问同一块资源,就不会有线程不安全问题。

图1.1 多线程访问临界资源线程安全和不安全的场景

为了让多跟线程能同时访问临界资源,并且保证线程安全,信号量的概念被引入,以保证进入临界区的线程不访问同一块临界资源,以此来提高多线程的效率。

信号量的本质为计数器count,用于表示临界区还有多少资源。

当某个执行流要访问临界区资源前,要先申请信号量,计数器count--,申请信号量的操作被称为P操作,如果临界区内还有资源,那么申请信号量就会成功,计数器count--,拿到信号量之后,该线程执行流就拥有了进入临界区的权利。

申请到了信号量,本质是一种资源预定机制,并不是说申请到了信号量已经在访问临界资源了,但申请到了信号量的执行流具有访问临界资源的权利,可以在适当的时候访问临界资源。

当执行流访问完临界资源后,要释放信号量,计数器count++,释放信号量的操作被称为V操作,这样之前等待信号量的资源,就可以拿到信号量,以进入临界区访问临界资源。

至于申请到了信号量后访问的是那一块临界资源,信号量本身并无法指定,需要程序员编程决定。

结论:(1). 信号量本质为计数器,用于表示还剩多少临界资源  (2). 访问临界资源前要通过申请信号量来预定临界资源,信号量计数器--,称为P操作  (3). 离开临界区要释放信号量,信号量计数器++,被称为V操作  (4). 如果临界区内没有剩余资源,此时信号量为0,线程申请不到信号量就会被阻塞。 

这里借助生活中的场景,来辅助理解信号量。假设某明星演唱会现场观看的座位数为200,这200个现场座位为共享资源,每个座位就是临界区内的一小块资源。当现场观看的票还没有卖出时,剩余资源数为200,初始信号量为200。

如果此时有人买走了一张票,那么他就预定了一个现场座位,即预定一份共享资源,即使他不去现场观看,那么这个座位也属于他,其他人不能占用,预定一张票,就是申请一个信号量,计数器count--,由200变为199。

如果某时200个座位都被预定了,剩余资源就变为0,类似于信号量为0,此时再有人想预定现场座位,就无法预定成功,这与线程在信号量为0的时候无法预定临界资源类似。

如果演唱会结束,或某人退票,那么就释放了一个临界区资源,信号量计数器count++,这时座位就又可以预定了,类似于多线程中某一线程执行流离开临界区释放信号量,这个信号量就可以被之前因为信号量为0而被阻塞的线程拿到,进入临界区访问资源。

1.2 信号量相关函数

信号量的初始化:

  • 通过函数sem_init可初始化信号量。
  • 初始化信号量的时候,就应当指定初始值,即:有多少临界资源可以被不同执行流访问。

sem_init -- 信号量初始化函数

函数原型:sem_init(sem_t *sem, int pshared, unsigned int value);

头文件:#include <semaphore.h>

函数参数:

  • sem -- 被初始化的信号量的地址
  • pshared -- 0表示同一进程下的线程间共享,1表示进程间共享
  • value -- 信号量的初始值

返回值:成功返回0,失败返回-1并设置错误码。

信号量等待:

  • 通过sem_wait函数,可以让线程等待信号量。
  • 如果当前信号量不为0,线程申请(等待)到了信号量,那么这个线程就预定了一份临界资源,信号量计数器--。
  • 如果当前信号量为0,即没有剩余的临界资源了,线程就需要等待一份临界资源被释放,才能申请到信号量。
  • 申请信号量,调用sem_wait的操作,被称为P操作。

sem_wait函数 -- 申请(等待)信号量

函数原型:int sem_wait(sem_t *sem)

头文件:#include<semaphore.h>

函数参数:sem -- 被等待的信号的地址

返回值:成功返回0,失败返回-1并设置错误码。

信号量释放:

  • 通过sem_post函数可以实现释放信号量资源。
  • 如果某一线程申请到了信号量并访问了临界资源,访问临界资源完成后,要释放信号量,让其他正在等待信号量的线程可以拿到信号量并访问临界资源。
  • 释放信号量,信号量计数器++,这样的操作被称为V操作。

sem_post函数 -- 释放信号量

函数原型:int sem_post(sem_t *sem)

头文件:#include <semaphore.h>

函数参数:sem -- 被等待的信号的地址。

返回值:函数执行成功返回0,失败返-1并设置错误码

二. 通过环形队列实现生产与消费者模型

2.1 环形结构解析

图2.1为环形队列的逻辑结构和物理结构图,在其底层实现代码中,依旧是采用线性数组来实现的,只不过我们通过特定的计算机代码,来使其行为与首尾相连的环形结构一致。

图2.1 环形队列的物理结构和逻辑结构

假设环形队列能够容纳N个元素,那么我们在拿到下标为index的位置时,如要找到其后面第k个元素的位置,计算方法为:(index + k) % N。

有两种方法,可以判断环形队列是空还是满:

  • 用计数器来辅助:如果计数器count = 0,环形队列就是空,如果等同于环形队列的最大容量N,即count = N,就是满。
  • 间隔空位:相比于环形队列的最大容量,多开辟一个数据空间,采用两个指针first和last记录首个元素位置和末尾元素后面的位置,如果last == fisrt,那么环形队列为空,如果(last + 1) % N == first 成立,那么环形队列为满,图2.2为这种方法的。
图2.2 环形队列满和空的情况

2.2 生产消费者模型与环形队列的联系

如果采用阻塞队列的方式来实现生产与消费者模型,由于C++ STL中提供的queue不向用户暴露底层实现,并且将阻塞队列视为一个整体来进行数据的写入和读取,造成了某一时刻只允许一个生产者线程或一个消费者线程访问临界资源(阻塞队列),为了保证线程安全,生产者写数据和消费者读数据不能够同时进行。

如图2.3所示,假设我们希望向p_step所指向的位置写数据,从c_step所指向的位置读数据,由于p_step和c_step所指向的是环形队列的不同位置,此时生产者和消费者线程如果并发执行,不会出现线程不安全问题,因为这两个执行流访问的是临界资源的不同区域。

但是,如果p_step和c_step指向环形队列的同一位置,此时生产者线程和消费者线程并发执行,则会访问临界资源的相同区域,引发线程不安全问题。

允许一定条件下的生产者线程和消费者线程并发执行,可以显著降低等待时间,提高程序整体的运行效率。

图2.3 生产与消费者线程可以并发执行和不能并发执行的场景

3.3 基于环形队列的生产与消费者模型实现代码

在程序中,可以采用信号量的方式来决定是否让生产者线程或消费者线程阻塞等待,我们假设环形队列的最大容量为N,那么就定义两个信号量:

  • _sem_space:空间信号量,表示是否还有剩余空间,初值设为N。
  • _sem_data:数据信号量,表示是否还有可读数据资源,初值设为0。

当生产者要向环形队列中写数据时,要先申请空间信号量,如果申请空间信号量成功,说明环形队列中有剩余空间,才能向环形队列中写数据,当访问完临界资源后,要释放数据信号量,唤醒因阻塞队列中没有数据而等待数据信号量的消费者线程。

当消费者从环形队列中读取数据时,要先申请数据信号量,如果申请成功,说明环形队列中有可读数据,这时消费者线程才能够读取环形队列中的数据,当访问完临界资源后,要释放空间信号量,唤醒因环形队列没有空间而阻塞等待空间信号量的生产者线程。

虽然信号量也是临界资源,但是对信号量的++/--操作是原子的,所以不会存在线程不安全问题。

代码3.1:头文件Sem.hpp -- 封装信号量

#pragma once
#include <iostream>
#include <semaphore.h>

// 封装用于操作信号量的类
class Sem
{
public:
    // 构造函数,实现初始化信号量
    Sem(int pshared, int value)
    {
        sem_init(&_sem, pshared, value);
    }

    // 析构函数,销毁信号量
    ~Sem()
    {
        sem_destroy(&_sem);
    }

    // 等待信号量 -- p操作
    void p()
    {
        sem_wait(&_sem);
    }

    // 释放信号量 -- v操作
    void v()
    {
        sem_post(&_sem);
    }

private:
    sem_t _sem;   // 信号量
};

代码3.2:头文件RingQueue.hpp -- 实现阻塞队列

#pragma once

#include <iostream>
#include <vector>
#include <pthread.h>
#include "Sem.hpp"

int g_DFL_CAPACITY = 5;  // 信号量默认初值

template<class T>
class RingQueue
{
public:
    // 构造函数
    RingQueue(int capacity = g_DFL_CAPACITY)
        : _ring_queue(capacity, T())
        , _capacity(capacity)
        , _p_step(0)
        , _c_step(0)
        , _sem_data(0)
        , _sem_space(capacity)
    { 
        // 初始化生产者线程和消费者线程互斥锁
        pthread_mutex_init(&_c_mtx, nullptr);
        pthread_mutex_init(&_p_mtx, nullptr);
    }

    // 析构函数
    ~RingQueue()
    {
        // 销毁生产者线程和消费者线程互斥锁
        pthread_mutex_destroy(&_c_mtx);
        pthread_mutex_destroy(&_p_mtx);
    }

    // 生产者写数据函数
    void push(const T& val)
    {
        // 1. 申请空间信号量 -- p操作
        _sem_space.p();

        // 2. 加锁 -> 写数据 -> 解锁
        pthread_mutex_lock(&_p_mtx);   // 加锁
        _ring_queue[_p_step++] = val;  // 写数据
        _p_step %= _capacity;          // 更新下标
        pthread_mutex_unlock(&_p_mtx); // 解锁

        // 3. 释放数据信号量
        _sem_data.v();
    }

    // 消费者读数据函数,data为输出型参数
    void pop(T* data)
    {
        // 1. 申请数据信号量
        _sem_data.p();
        
        // 2. 加锁 -> 读数据 -> 解锁
        pthread_mutex_lock(&_c_mtx);   // 加锁
        *data = _ring_queue[_c_step++]; // 读数据
        _c_step %= _capacity;          // 更新下标
        pthread_mutex_unlock(&_c_mtx); // 解锁

        // 3. 释放空间信号量
        _sem_space.v();
    }

private:
    std::vector<T> _ring_queue; // 用线性表模拟实现的环形队列
    int _capacity;              // 环形队列容量
    int _p_step;                // 生产者向环形队列写数据的下标位置
    int _c_step;                // 消费者从环形队列中读取数据的下标
    pthread_mutex_t _c_mtx;     // 用于控制消费者线程的互斥锁
    pthread_mutex_t _p_mtx;     // 用于控制生产者线程的互斥锁
    Sem _sem_data;              // 用于表示环形队列中现有数据的信号量
    Sem _sem_space;             // 用于表示环形队列中剩余空间的信号量 
};

代码3.3:ConProd.cc文件 -- 生产消费者模型main函数所在源文件

#include <iostream>
#include <pthread.h>
#include <unistd.h>
#include "RingQueue.hpp"

// 消费者线程入口函数
void* consume(void* args)
{
    RingQueue<int> *prq = (RingQueue<int>*)args;

    // 间隔1s从环形队列中读数据
    int data;
    while(true)
    {
        prq->pop(&data);
        std::cout << "消费数据:" << data << std::endl;
        sleep(1);
    }

    return nullptr;
}

void* product(void* args)
{
    RingQueue<int> *prq = (RingQueue<int>*)args;
    
    // 死循环向环形队列中写数据
    int a = 0;
    while(true)
    {
        std::cout << "生产数据:" << a << std::endl;
        prq->push(a);
        a++;
    }

    return nullptr;
}

int main()
{
    RingQueue<int> *prq = new RingQueue<int>();

    // 闯将两个生产者线程,三个消费者线程
    pthread_t p[2], c[3];
    pthread_create(p, nullptr, product, (void*)prq);
    pthread_create(p + 1, nullptr, product, (void*)prq);
    pthread_create(c, nullptr, consume, (void*)prq);
    pthread_create(c + 1, nullptr, consume, (void*)prq);
    pthread_create(c + 2, nullptr, consume, (void*)prq);

    // 阻塞等待生产者消费者线程退出
    pthread_join(p[0], nullptr);
    pthread_join(p[1], nullptr);
    pthread_join(c[0], nullptr);
    pthread_join(c[1], nullptr);
    pthread_join(c[2], nullptr);

    return 0;
}

三. 总结

  • 信号量的本质为一计数器,用于表示临界区内还剩多少资源。
  • 通过使用信号量,可让多个线程执行流去访问临界资源的不同区域,达到某时刻多个执行流进入临界区,但不会造成线程不安全的目的。
  • 线程进入临界区前要先申请信号量,在离开临界区后要释放信号量。
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这是一门linux下c++通讯架构实战课程,针对c/c++语言已经掌握的很熟并希望进一步深造以将来用c++在linux下从事网络通讯领域/网络服务器的开发和架构工作。这门课程学习难度颇高但也有着极其优渥的薪水(最少30K月薪,最高可达60-80K月薪),这门课程,会先从nginx源码的分析和讲解开始,逐步开始书写属于自己的高性能服务器框架代码,完善个人代码库,这些,将会是您日后能取得高薪的重要筹码。本课程原计划带着大家逐行写代码,但因为代码实在过于复杂和精细,带着写代码可能会造成每节课至少要4~5小时的超长时间,所以老师会在课前先写好代码,主要的时间花费在逐行讲解这些代码上,这一点望同学们周知。如果你觉得非要老师领着写代码才行的话,老师会觉得你当前可能学习本门课程会比较吃力,请不要购买本课程,以免听不懂课程并给老师差评,差评也会非常影响老师课程的销售并造成其他同学的误解。 这门课程要求您具备下面的技能:(1)对c/c++语言掌握的非常熟练,语言本身已经不是继续学习的障碍,并不要求您一定熟悉网络或者linux;(2)对网络通讯架构领域有兴趣、勇于挑战这个高难度的开发领域并期望用大的付出换取高薪;在这门课程中,实现了一个完整的项目,其中包括通讯框架和业务逻辑框架,浓缩总结起来包括如下几点:(1)项目本身是一个极完整的多线程高并发的服务器程序;(2)按照包头包体格式正确的接收客户端发送过来的数据包, 完美解决收包时的数据粘包问题;(3)根据收到的包的不同来执行不同的业务处理逻辑;(4)把业务处理产生的结果数据包正确返回给客户端;本项目用到的主要开发技术和特色包括:(1)epoll高并发通讯技术,用到的触发模式是epoll中的水平触发模式【LT】;(2)自己写了一套线程池来处理业务逻辑,调用适当的业务逻辑处理函数处理业务并返回给客户端处理结果;(3)线程之间的同步技术包括互斥信号等等;(4)连接池中连接的延迟回收技术,这是整个项目中的精华技术,极大程度上消除诸多导致服务器程序工作不稳定的因素;(5)专门处理数据发送的一整套数据发送逻辑以及对应的发送线程;(6)其他次要技术,包括信号、日志打印、fork()子进程、守护进程等等;
以下是一些值得推荐的Linux系统编程书籍: 1.《Linux系统编程手册》(Linux System Programming):Michael Kerrisk所著的这本书是学习Linux系统编程的绝佳入门书籍,它涵盖了Linux系统编程的所有基础知识,包括进程管理、文件I/O、信号处理、线程、进程间通信等。此外,该书还提供了大实例代码和实践操作,可以帮助读者更好地理解Linux系统编程的重要概念和技术。 2.《UNIX环境高级编程》(Advanced Programming in the UNIX Environment):这是一本经典的UNIX系统编程书籍,由W. Richard Stevens所著。该书详细介绍了UNIX系统编程的各个方面,包括进程、信号、进程间通信、文件I/O、网络编程等。该书还提供了大实例和代码,以及详细的注释和解释,可以帮助读者深入理解UNIX系统编程的各个方面。 3.《UNIX网络编程》(UNIX Network Programming):这是另一本UNIX系统编程的经典书籍,由W. Richard Stevens所著。该书介绍了UNIX网络编程的各个方面,包括套接字编程、进程间通信、网络协议、TCP/IP协议等。该书提供了大实例和代码,可以帮助读者深入理解UNIX网络编程的各个方面。 4.《深入理解Linux内核》(Understanding the Linux Kernel):这是一本关于Linux内核的详细介绍和解释的书籍,由Daniel P. Bovet和Marco Cesati所著。该书介绍了Linux内核的各个方面,包括进程管理、内存管理、文件系统、设备驱动程序等。该书提供了大的实例和代码,可以帮助读者深入理解Linux内核的各个方面。 5.《Linux设备驱动程序》(Linux Device Drivers):这是一本关于Linux设备驱动程序的详细介绍和解释的书籍,由Alessandro Rubini和Jonathan Corbet所著。该书介绍了Linux设备驱动程序的各个方面,包括字符设备、块设备、网络设备等。该书提供了大的实例和代码,可以帮助读者深入理解Linux设备驱动程序的各个方面。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值