C++11特性：C++线程类 thread

想不出来_6

于 2023-12-23 22:01:00 发布

阅读量922

点赞数 22

文章标签： c++ 开发语言笔记

本文链接：https://blog.csdn.net/qq_73185160/article/details/135174434

版权

C++11之前，C++语言没有对并发编程提供语言级别的支持，这使得我们在编写可移植的并发程序时，存在诸多的不便。现在C++11中增加了线程以及线程相关的类，很方便地支持了并发编程，使得编写的多线程程序的可移植性得到了很大的提高。

C++11中提供的线程类叫做std::thread，基于这个类创建一个新的线程非常的简单，只需要提供线程函数或者函数对象即可，并且可以同时指定线程函数的参数。我们首先来了解一下这个类提供的一些常用API：

1. 构造函数

// ①
thread() noexcept;
// ②
thread( thread&& other ) noexcept;
// ③
template< class Function, class... Args >
explicit thread( Function&& f, Args&&... args );
// ④
thread( const thread& ) = delete;

构造函数①：默认构造函，构造一个线程对象，在这个线程中不执行任何处理动作。

构造函数②：移动构造函数，将 other 的线程所有权转移给新的thread 对象。之后 other 不再表示执行线程。

构造函数③：创建线程对象，并在该线程中执行函数f中的业务逻辑，args是要传递给函数f的参数

任务函数f的可选类型有很多，具体如下：

1. 普通函数，类成员函数，匿名函数，仿函数（这些都是可调用对象类型）。
2. 可以是可调用对象包装器类型，也可以是使用绑定器绑定之后得到的类型（仿函数）。

构造函数④：使用=delete显示删除拷贝构造, 不允许线程对象之间的拷贝。

2. 公共成员函数

2.1 get_id()：

应用程序启动之后默认只有一个线程，这个线程一般称之为主线程或父线程，通过线程类创建出的线程一般称之为子线程，每个被创建出的线程实例都对应一个线程ID，这个ID是唯一的，可以通过这个ID来区分和识别各个已经存在的线程实例，这个获取线程ID的函数叫做get_id()，函数原型如下：

std::thread::id get_id() const noexcept;

示例程序如下：

#include <iostream>
#include <thread>
#include <chrono>
using namespace std;

void func(int num, string str)
{
    for (int i = 0; i < 10; ++i)
    {
        cout << "子线程: i = " << i << "num: " 
             << num << ", str: " << str << endl;
    }
}

void func1()
{
    for (int i = 0; i < 10; ++i)
    {
        cout << "子线程: i = " << i << endl;
    }
}

int main()
{
    cout << "主线程的线程ID: " << this_thread::get_id() << endl;
    thread t(func, 520, "i love you");
    thread t1(func1);
    cout << "线程t 的线程ID: " << t.get_id() << endl;
    cout << "线程t1的线程ID: " << t1.get_id() << endl;
}

输出结果为：

主线程的线程ID: 27308
线程t 的线程ID: 4924
线程t1的线程ID: 18780
子线程: i = 0
子线程: i = 1
子线程: i = 2
子线程: i = 3
子线程: i = 4
子线程: i = 5
子线程: i = 6
子线程: i = 7
子线程: i = 8
子线程: i = 9
子线程: i = 0num: 520, str: i love you
子线程: i = 1num: 520, str: i love you
子线程: i = 2num: 520, str: i love you
子线程: i = 3num: 520, str: i love you
子线程: i = 4num: 520, str: i love you
子线程: i = 5num: 520, str: i love you
子线程: i = 6num: 520, str: i love you
子线程: i = 7num: 520, str: i love you
子线程: i = 8num: 520, str: i love you
子线程: i = 9num: 520, str: i love you

1. thread t(func, 520, "i love you");：创建了子线程对象t，func()函数会在这个子线程中运行。
2. func()是一个回调函数，线程启动之后就会执行这个任务函数，程序猿只需要实现即可。
3. func()的参数是通过thread的参数进行传递的，520,i love you都是调用func()需要的实参。
4. 线程类的构造函数③是一个变参函数，因此无需担心线程任务函数的参数个数问题。
5. 任务函数func()一般返回值指定为void，因为子线程在调用这个函数的时候不会处理其返回值。
6. thread t1(func1);：子线程对象t1中的任务函数func1()，没有参数，因此在线程构造函数中就无需指定了。
7. 通过线程对象调用get_id()就可以知道这个子线程的线程ID了，t.get_id()，t1.get_id()。

8. 基于命名空间this_thread得到当前线程的线程ID。

注意：

在上面的示例程序中有一个bug，在主线程中依次创建出两个子线程，打印两个子线程的线程ID，最后主线程执行完毕就退出了（主线程就是执行main()函数的那个线程）。默认情况下，主线程销毁时会将与其关联的两个子线程也一并销毁，但是这时有可能子线程中的任务还没有执行完毕，最后也就得不到我们想要的结果了。

当启动了一个线程（创建了一个thread对象）之后，在这个线程结束的时候（std::terminate()），我们如何去回收线程所使用的资源呢？thread库给我们两种选择：

1. 加入式（join()）
2. 分离式（detach()）

另外，我们必须要在线程对象销毁之前在二者之间作出选择，否则程序运行期间就会有bug产生。

2.2 join()：

join()字面意思是连接一个线程，意味着主动地等待线程的终止（线程阻塞）。在某个线程中通过子线程对象调用join()函数，调用这个函数的线程被阻塞，但是子线程对象中的任务函数会继续执行，当任务执行完毕之后join()会清理当前子线程中的相关资源然后返回，同时，调用该函数的线程解除阻塞继续向下执行。

再次强调，我们一定要搞清楚这个函数阻塞的是哪一个线程，函数在哪个线程中被执行，那么函数就阻塞哪个线程。该函数的函数原型如下：

void join();

有了这样一个线程阻塞函数之后，就可以解决在上面测试程序中的bug了，如果要阻塞主线程的执行，只需要在主线程中通过子线程对象调用这个方法即可，当调用这个方法的子线程对象中的任务函数执行完毕之后，主线程的阻塞也就随之解除了。修改之后的示例代码如下：

int main()
{
    cout << "主线程的线程ID: " << this_thread::get_id() << endl;
    thread t(func, 520, "i love you");
    thread t1(func1);
    cout << "线程t 的线程ID: " << t.get_id() << endl;
    cout << "线程t1的线程ID: " << t1.get_id() << endl;
    t.join();
    t1.join();
}

当主线程运行到t.join();，根据子线程对象t的任务函数func()的执行情况，主线程会做如下处理：

1. 如果任务函数func()还没执行完毕，主线程阻塞，直到任务执行完毕，主线程解除阻塞，继续向下运行
2. 如果任务函数func()已经执行完毕，主线程不会阻塞，继续向下运行

同理t1.join();同样如此。

为了更好的理解join()的使用，再来给大家举一个例子，场景如下：

程序中一共有三个线程，其中两个子线程负责分段下载同一个文件，下载完毕之后，由主线程对这个文件进行下一步处理，那么示例程序就应该这么写：

#include <iostream>
#include <thread>
#include <chrono>
using namespace std;

void download1()
{
    // 模拟下载, 总共耗时500ms，阻塞线程500ms
    this_thread::sleep_for(chrono::milliseconds(500));
    cout << "子线程1: " << this_thread::get_id() << ", 找到历史正文...." << endl;
}

void download2()
{
    // 模拟下载, 总共耗时300ms，阻塞线程300ms
    this_thread::sleep_for(chrono::milliseconds(300));
    cout << "子线程2: " << this_thread::get_id() << ", 找到历史正文...." << endl;
}

void doSomething()
{
    cout << "集齐历史正文, 呼叫罗宾...." << endl;
    cout << "历史正文解析中...." << endl;
    cout << "起航，前往拉夫德尔...." << endl;
    cout << "找到OnePiece, 成为海贼王, 哈哈哈!!!" << endl;
    cout << "若干年后，草帽全员卒...." << endl;
    cout << "大海贼时代再次被开启...." << endl;
}

int main()
{
    thread t1(download1);
    thread t2(download2);
    // 阻塞主线程，等待所有子线程任务执行完毕再继续向下执行
    t1.join();
    t2.join();
    doSomething();
}

示例程序输出的结果：

子线程2: 72540, 找到历史正文....
子线程1: 79776, 找到历史正文....
集齐历史正文, 呼叫罗宾....
历史正文解析中....
起航，前往拉夫德尔....
找到OnePiece, 成为海贼王, 哈哈哈!!!
若干年后，草帽全员卒....
大海贼时代再次被开启....

在上面示例程序中最核心的处理是在主线程调用doSomething();之前在第35、36行通过子线程对象调用了join()方法，这样就能够保证两个子线程的任务都执行完毕了，也就是文件内容已经全部下载完成，主线程再对文件进行后续处理，如果子线程的文件没有下载完毕，主线程就去处理文件，很显然从逻辑上讲是有问题的。

2.3 detach()：

detach()函数的作用是进行线程分离，分离主线程和创建出的子线程。在线程分离之后，主线程退出也会一并销毁创建出的所有子线程，在主线程退出之前，它可以脱离主线程继续独立的运行，任务执行完毕之后，这个子线程会自动释放自己占用的系统资源。（其实就是孩子翅膀硬了，和家里断绝关系，自己外出闯荡了，如果家里被诛九族还是会受牵连）。该函数函数原型如下：

void detach();

线程分离函数没有参数也没有返回值，只需要在线程成功之后，通过线程对象调用该函数即可，继续将上面的测试程序修改一下：

int main()
{
    cout << "主线程的线程ID: " << this_thread::get_id() << endl;
    thread t(func, 520, "i love you");
    thread t1(func1);
    cout << "线程t 的线程ID: " << t.get_id() << endl;
    cout << "线程t1的线程ID: " << t1.get_id() << endl;
    t.detach();
    t1.detach();
    // 让主线程休眠, 等待子线程执行完毕
    this_thread::sleep_for(chrono::seconds(5));
}

若没有最后的让主线程休眠的语句，终端可能有些语句不会打印就结束了，子线程会继续在后台执行，直至其完成或被操作系统终止。

注意事项：

线程分离函数detach()不会阻塞线程，子线程和主线程分离之后，在主线程中就不能再对这个子线程做任何控制了，比如：通过join()阻塞主线程等待子线程中的任务执行完毕，或者调用get_id()获取子线程的线程ID。有利就有弊，鱼和熊掌不可兼得，建议使用join()。

2.5 joinable()：

joinable()函数用于判断主线程和子线程是否处理关联（连接）状态，一般情况下，二者之间的关系处于关联状态，该函数返回一个布尔类型：

1. 返回值为true：主线程和子线程之间有关联（连接）关系
2. 返回值为false：主线程和子线程之间没有关联（连接）关系

bool joinable() const noexcept;

示例代码如下：

#include <iostream>
#include <thread>
#include <chrono>
using namespace std;

void foo()
{
    this_thread::sleep_for(std::chrono::seconds(1));
}

int main()
{
    thread t;
    cout << "before starting, joinable: " << t.joinable() << endl;

    t = thread(foo);
    cout << "after starting, joinable: " << t.joinable() << endl;

    t.join();
    cout << "after joining, joinable: " << t.joinable() << endl;

    thread t1(foo);
    cout << "after starting, joinable: " << t1.joinable() << endl;
    t1.detach();
    cout << "after detaching, joinable: " << t1.joinable() << endl;
}

示例代码打印的结果如下：

before starting, joinable: 0
after starting, joinable: 1
after joining, joinable: 0
after starting, joinable: 1
after detaching, joinable: 0

基于示例代码打印的结果可以得到以下结论：

1. 在创建的子线程对象的时候，如果没有指定任务函数，那么子线程不会启动，主线程和这个子线程也不会进行连接。
2. 在创建的子线程对象的时候，如果指定了任务函数，子线程启动并执行任务，主线程和这个子线程自动连接成功。
3. 子线程调用了detach()函数之后，父子线程分离，同时二者的连接断开，调用joinable()返回false。
4. 在子线程调用了join()函数，子线程中的任务函数继续执行，直到任务处理完毕，这时join()会清理（回收）当前子线程的相关资源，所以这个子线程和主线程的连接也就断开了，因此，调用join()之后再调用joinable()会返回false。

2.6 operator=：

线程中的资源是不能被复制的，因此通过=操作符进行赋值操作最终并不会得到两个完全相同的对象。

// move (1)	
thread& operator= (thread&& other) noexcept;
// copy [deleted] (2)	
thread& operator= (const other&) = delete;

通过以上=操作符的重载声明可以得知：

1. 如果other是一个右值，会进行资源所有权的转移。
2. 如果other不是右值，禁止拷贝，该函数被显示删除（=delete），不可用。

示例代码如下：

#include <iostream>
#include <thread>
#include <chrono>

void task() {
	// 一个简单的任务
	std::cout << "Task is running..." << std::endl;
	std::this_thread::sleep_for(std::chrono::seconds(1));
	std::cout << "Task completed." << std::endl;
}

int main() {
	std::thread thread1(task); // 创建一个线程执行 task

	std::thread thread2;       // 创建一个空线程
	thread2 = std::move(thread1);// 使用移动赋值将 thread1 的执行移动给 thread2


	if (thread1.joinable()) {
		std::cout << "进程1" << std::endl;
		thread1.join(); // 检查 thread1 是否可 join，如果是，则 join
	}

	if (thread2.joinable()) {
		std::cout << "进程2" << std::endl;
		thread2.join(); // 确保 thread2 完成执行
	}

	return 0;
}

输出结果为：

进程2
Task is running...
Task completed.

3. 静态函数

thread线程类还提供了一个静态方法，用于获取当前计算机的CPU核心数，根据这个结果在程序中创建出数量相等的线程，每个线程独自占有一个CPU核心，这些线程就不用分时复用CPU时间片，此时程序的并发效率是最高的。

static unsigned hardware_concurrency() noexcept;

示例代码如下：

#include <iostream>
#include <thread>
using namespace std;

int main()
{
    int num = thread::hardware_concurrency();
    cout << "CPU number: " << num << endl;
}

注意：

在 C++ 中，创建线程的最大数量没有一个严格的上限，这主要取决于操作系统和系统资源。不过，有几个因素通常会影响你能创建的线程数量：

1. 操作系统限制：不同的操作系统和系统配置可能有不同的线程限制。例如，某些系统可能限制单个进程可以创建的线程数量。

2. 内存限制：每个线程都需要一定量的堆栈内存。系统的总内存大小（包括物理内存和虚拟内存）限制了可以创建的线程总数。如果系统内存不足，创建过多的线程可能会导致内存耗尽。

3. 性能考虑：即使可以创建成百上千的线程，但实际上这可能并不高效。线程太多可能导致处理器花费大量时间在线程之间切换上，而非执行实际的工作负载。

通常，一个好的做法是使用与处理器核心数量相当的线程数量，这尤其适用于计算密集型任务。对于 I/O 密集型任务，由于线程经常被阻塞，可以使用更多的线程。

实际上，最好的做法是根据应用程序的具体需求来动态确定线程数量。例如，可以使用线程池，并根据工作负载来增加或减少线程数量。

本文参考：C++线程的使用 | 爱编程的大丙 (subingwen.cn)