目录
1. 问题描述
先描述下场景:
主线程(执行 main()
方法的线程)在退出时,全局变量(包括 static 和 non-static 的全局变量)会被释放,此时如果子线程仍在访问该全局变量,则有可能访问的是已经被释放的全局变量,从而有可能导致进程崩溃。
2. 问题复现
为复现此问题,编写如下代码:
class A {
public:
A() : num(new int(10)) {
printf("%s\n", __PRETTY_FUNCTION__);
}
~A() {
printf("%s\n", __PRETTY_FUNCTION__);
delete num;
num = nullptr;
printf("After delete\n");
}
public:
int *num{nullptr};
};
// 定义一个全局变量
A a;
void test() {
printf("Outer: num=%d, %p, %p\n", *a.num, &a, a.num);
for (int i = 0; i < 10; ++i) {
auto func = []() {
long count = 10000000000;
while (count-- > 0) {
// 为了复现崩溃,要持续访问全局变量
*a.num = 20;
}
printf("thread exit\n");
};
std::thread t(func);
t.detach();
}
}
int main() {
printf("Enter main\n");
test();
std::this_thread::sleep_for(std::chrono::seconds(1));
log("Leave main");
return 0;
}
上述代码在我机器上(编译器 g++ 7.5.0)的执行结果如下:
A::A()
Enter main
Outer: num=10, 0x5590763090, 0x55cf71ee70
Leave main
A::~A()
After delete
Segmentation fault (core dumped)
可以看到程序出现了 Segmentation fault 的崩溃,原因就是全局变量 a
在进行析构时,将其成员变量 num
delete 并置空之后,子线程仍在访问 a.num
,从而导致进程崩溃。
3. 解决方法
解决该问题的方法是:
- 保证线程的退出顺序,即先退出子线程,再退出主线程。
- 保证变量的访问操作合法,即子线程在访问前对全局变量进行合法型校验。