【muduo源码剖析】Thread/ThreadPool源码解析

最新推荐文章于 2024-05-14 08:15:13 发布

Last-Week

最新推荐文章于 2024-05-14 08:15:13 发布

阅读量442

点赞数 1

分类专栏： muduo源码解析文章标签： c++ linux 后端服务器 muduo

本文链接：https://blog.csdn.net/weixin_46272577/article/details/126944605

版权

muduo源码解析专栏收录该内容

5 篇文章 1 订阅

订阅专栏

文章目录

前言
从EchoServer入手查看调用过程
EventLoopThreadPool详解
- EventLoopThreadPool重要成员
- 线程池中简单的负载均衡
EventLoopThread详解

前言

参考muduo库使用C++11重写网络库

GitHub地址：Tiny C++ Network Library

muduo 实现了 Thread 类封装了线程的基本操作，这里使用 C++ 11 的操作代替。然后将 Thread，EventLoop 放在一块实现了 EventLoopThread，这对应着 one loop per thread，一个线程有一个事件循环。

既然有了线程，那么为了节省创建线程的开销，muduo 还继续向上封装了 EventLoopThreadPool，即事件循环线程池。此类被 TcpServer 所调用，创建一系列线程并执行对应的线程初始化回调函数。

因为EventLoopThredPool、EventLoopThread、Thread联系紧密，本文打算从线程池创建开始逐步自定向下讲解这几个类之间的调用关系。

从EchoServer入手查看调用过程

大致流程如下图：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RFVUVBmR-1663603668417)(https://syz-picture.oss-cn-shenzhen.aliyuncs.com/D:%5CPrograme%20Files(x86)]%5CPicGo1658586771575-1db8502a-a993-450b-9ec2-71e13100dd41.png)

muduo 编程得一个入门案例：

int main()
{
    EventLoop loop;
    InetAddress addr(4567);    
    EchoServer server(&loop, addr, "EchoServer-01");
    //启动TcpServer服务器
    server.start();      
    loop.loop(); //执行EventLoop::loop()函数，这个函数在概述篇的EventLoop小节有提及，自己去看一下！！
    
    return 0;
}

从启动服务器这一行server.start();，我们深入进去查看。

// 启动服务器
void TcpServer::start()
{
    if (started_.getAndSet(1) == 0)
    {
        // 开启线程池
        threadPool_->start(threadInitCallback_);
        
        assert(!acceptor_->listening());
        // 将Acceptor::listen加入loop.runInLoop开启监听
        loop_->runInLoop(
        	std::bind(&Acceptor::listen, get_pointer(acceptor_)));
    }
}

这里看到了开启线程池的代码了，threadPool_->start(threadInitCallback_);。里面传入了一个线程池初始化的回调函数，这个函数是用户自己自定义的。继续查看线程池的创建函数EventLoopThreadPool::start

void EventLoopThreadPool::start(const ThreadInitCallback& cb)
{
	/**省略***/
    
    // 创建一定数量线程
    for (int i = 0; i < numThreads_; ++i)
    {
        char buf[name_.size() + 32];
        snprintf(buf, sizeof buf, "%s%d", name_.c_str(), i);
        // 创建EventLoopThread，传入线程初始化的回调函数
        EventLoopThread* t = new EventLoopThread(cb, buf);
        // 线程容器加入此线程
        threads_.push_back(std::unique_ptr<EventLoopThread>(t));
        // EventLoop容器加入此线程的EventLoop
        // 此处已经生成了新的线程
        loops_.push_back(t->startLoop());
    }
    // 单线程运行
    if (numThreads_ == 0 && cb)
    {
        cb(baseLoop_);
    }
}

其内部创建一定数量的线程，并且标注上每一个线程的名字。根据名字和创建EventLoopThread，并将其加入容器进行管理。这里不直接创建Thread变量，而是间接创建EventLoopThread，事件循环和线程由它来管理（相当于向上层封装了一下）。

loops_.push_back(t->startLoop());此处中的startLoop函数会创建新的线程，新线程执行任务创建一个的EventLoop并返回。线程池类加入新的EventLoop到容器中管理，我们继续往下查看startLoop()：

// startLoop() => Thread::start() => pthread_create()
EventLoop* EventLoopThread::startLoop()
{
    assert(!thread_.started());
    // 调用startLoop即开启一个新线程，创建新线程时指定了执行的函数和需要的参数
    thread_.start();

    EventLoop* loop = NULL;
    {
        // 等待新线程执行threadFunc完毕，所以使用cond_.wait
        MutexLockGuard lock(mutex_);
        /**
         * threadFunc会被前几行创建的新线程所执行
         * 我们需要等待这个函数执行完毕，否则loop_指针会指向无意义的地方
         * 所以使用了条件变量
         */
        while (loop_ == NULL)
        {
            cond_.wait();
        }
        loop = loop_;
    }

    return loop;
}

内部调用thread_.start();用于开启一个新的线程，其实际调用了pthread_create函数。我们创建新的线程，其实也就是创建subReactor，其内部也应有一个EventLoop。而这个EventLoop的创建过程在EventLoopThread::threadFunc函数完成的。Thread的某个变量绑定了此函数，并在Thread的初始化过程中调用。从而完成了新EventLoop的创建。

// 这个函数会在Thread内部执行
void EventLoopThread::threadFunc()
{
    // 创建一个临时对象
    EventLoop loop;

    // 如果设置了回调函数则执行
    if (callback_)
    {
        callback_(&loop);
    }

    {
        // 确定生成了EventLoop对象，且loop_指向了有意义的地址则唤醒
        MutexLockGuard lock(mutex_);
        loop_ = &loop;
        // 唤醒阻塞
        cond_.notify();
    }
    // 执行事件循环
    loop.loop();
    // assert(exiting_);
    // 执行下面的代码说明事件循环结束，我们要防止loop_变成悬空指针
    // 这部分需要加锁
    MutexLockGuard lock(mutex_);
    loop_ = NULL;
}

生成EventLoop之后就直接执行了loop.loop()，如果不主动结束那么会一直进行事件循环。

EventLoopThreadPool详解

EventLoopThreadPool重要成员

class EventLoopThreadPool : noncopyable
{
public:
    // 开启线程池
    typedef std::function<void(EventLoop*)> ThreadInitCallback;

    EventLoopThreadPool(EventLoop* baseLoop, const string& nameArg);
    ~EventLoopThreadPool();
    // 设置线程数量
    void setThreadNum(int numThreads) { numThreads_ = numThreads; } 
    // 开启线程池
    void start(const ThreadInitCallback& cb = ThreadInitCallback());

    // valid after calling start()
    /// round-robin
    // 轮询获取下一个线程
    EventLoop* getNextLoop();

    /// with the same hash code, it will always return the same EventLoop
    EventLoop* getLoopForHash(size_t hashCode);

    // 获取所有EventLoop
    std::vector<EventLoop*> getAllLoops();

    // 是否已经开启
    bool started() const
    { return started_; }

    // 返回名字
    const string& name() const
    { return name_; }

private:
    /**
     * 主线程的事件循环驱动，TcpServer所在的事件驱动循环，创建TcpServer传入的EventLoop
     * 通常只负责监听客户端连接请求
     */
    EventLoop* baseLoop_;  // mainLoop
    string name_; // 线程池姓名
    bool started_; // 是否开启
    int numThreads_; // 线程数量
    int next_; // 标记下次应该取出哪个线程，采用round_robin
    std::vector<std::unique_ptr<EventLoopThread>> threads_; // 存储线程池中所有的线程
    std::vector<EventLoop*> loops_; // 存储线程池中所有的EventLoop
};

线程池中简单的负载均衡

mainReactor每次监听到新连接，并创建好负责连接的对象后会将其分派到某个subReactor。这是通过简单的轮询算法实现的。

EventLoop* EventLoopThreadPool::getNextLoop()
{
    baseLoop_->assertInLoopThread();
    assert(started_);
    // 新创建的EventLoop指针，先指向baseloop
    EventLoop* loop = baseLoop_;

    if (!loops_.empty())
    {
        // round-robin
        // 获取下一个线程
        loop = loops_[next_];
        ++next_;
        // 防止超出界限
        if (implicit_cast<size_t>(next_) >= loops_.size())
        {
            next_ = 0;
        }
    }
    return loop;
}

EventLoopThread详解

muduo 强调按照「one loop per thread」。即，一个线程中只能有一个事件循环。这在代码中也是有体现的，muduo 的将EventLoop和Thread类对象组合到一起作为EventLoopThread的成员变量。

这个EventLoopThread的结构天然的对应着「one loop per thread」。

EventLoopThread重要变量

class EventLoopThread : noncopyable
{
public:
	// 线程初始化回调函数
    typedef std::function<void(EventLoop*)> ThreadInitCallback; 
	
    EventLoopThread(const ThreadInitCallback& cb = ThreadInitCallback(),
                    const string& name = string());
    ~EventLoopThread();
    // 开启事件循环
    EventLoop* startLoop(); 

private:
	// 交给Thread执行，在栈上创建EventLoop并执行事件循环
    void threadFunc();

    EventLoop* loop_ GUARDED_BY(mutex_); // EventLoop对象
    bool exiting_;  // 事件循环线程是否停止执行loop.loop()
    Thread thread_; // 自定义线程类对象
    MutexLock mutex_;
    Condition cond_ GUARDED_BY(mutex_);
    ThreadInitCallback callback_; // 线程初始化回调函数
};

这里重点关注thread_，其在初始化的时候就被绑定了EventLoop的成员函数EventLoopThread::threadFunc。所以我们执行EventLoopThread::startLoop()的时候，Thread可以调用EventLoopThread的成员方法。

EventLoopThread::EventLoopThread(const ThreadInitCallback& cb,
                                 const string& name)
  : loop_(NULL),
    exiting_(false),
    thread_(std::bind(&EventLoopThread::threadFunc, this), name), // 新线程绑定此函数
    mutex_(),
    cond_(mutex_),
    callback_(cb) // 传入的线程初始化回调函数，用户自定义
{
}

开启事件循环的细节

EventLoop* EventLoopThread::startLoop()
{
    assert(!thread_.started());
    // 调用startLoop即开启一个新线程，创建新线程时指定了执行的函数和需要的参数
    thread_.start();

    EventLoop* loop = NULL;
    {
        // 等待新线程执行threadFunc完毕，所以使用cond_.wait
        MutexLockGuard lock(mutex_);
        /**
         * threadFunc会被前几行创建的新线程所执行
         * 我们需要等待这个函数执行完毕，否则loop_指针会指向无意义的地方
         * 所以使用了条件变量
         */
        while (loop_ == NULL)
        {
            cond_.wait();
        }
        loop = loop_;
    }

    return loop;
}

注意thread_.start(); 这里，此处已经开启了一个新的线程，新的线程会执行指定的函数。在此函数内部，会执行EventLoopThread::threadFun函数。其会生成一个EventLoop对象并让loop_ = loop;

但是这里是异步执行的：

当前线程会往下执行访问loop_变量
开启的新线程往下执行会调用EventLoopThread::threadFun函数生成EventLoop。

如果还未生成EventLoop时候，当前线程就访问了loop_变量，那么就是访问了不合法的地址。这是会造成程序崩溃的！因此，我们使用了条件变量，并增加了判断语句，当loop_ == NULL时候继续阻塞等待。

Thread::start()真正开始创建线程

thread_.start内部的操作是什么样子的？这里放出关键的代码

/**
 * 内部调用pthread_create创建新的线程
 * Thread::start => startThread => data.runInThread => func_
 */
void Thread::start()
{
    started_ = true;
    detail::ThreadData* data = new detail::ThreadData(func_, name_, &tid_, &latch_);
    if (pthread_create(&pthreadId_, NULL, &detail::startThread, data))
    {
        started_ = false;
        delete data; // or no delete?
        LOG_SYSFATAL << "Failed in pthread_create";
    }
    else
    {
        latch_.wait();
        assert(tid_ > 0);
    }
}

/**
 * 创建线程时会将其作为新线程执行的函数
 * 向其传入需要的参数
 */
void* startThread(void* obj)
{
    // 传入参数
    ThreadData* data = static_cast<ThreadData*>(obj);
    data->runInThread();
    delete data;
    return NULL;
}

可以看见内部调用了pthread_create创建了新线程，新线程指定运行&detail::startThread函数。而&detail::startThread函数内部将参数进行强制类型转换后又继续调用data->runInThread();

这个内部就会真正的调用EventLoopThread::threadFun了。最开始的时候EventLoopThread::threadFun就被绑定到了Thread类的成员变量中。

Thread::Thread(ThreadFunc func, const string& n)
  : started_(false),
    joined_(false),
    pthreadId_(0),
    tid_(0),
    func_(std::move(func)),
    name_(n),
    latch_(1)
{
      setDefaultName();
}