目录
POSIX线程库
pthread线程库是 POSIX线程库的一部分,POSIX线程库也叫原生线程库;
遵守 POSIX标准:与线程有关的函数构成了一个完整的系列,绝大多数函数的名字都是以“pthread_”开头的
要使用这些函数库,要通过引入头文<pthread.h>
链接这些线程函数库时要使用编译器命令的 “-lpthread” 选项;成功返回0,失败返回-1
多线程创建
主线程创建一批线程;
没有在循环创建中添加sleep();
void* handler(void* arg)
{
const char* name = (const char*)arg;
while(true)
{
cout<<"new thread sucess name:"<<name<<endl;
sleep(1);
}
}
int main()
{
pthread_t tid;
char namebuff[64];
for(int i = 0;i<5;i++)
{
//格式化
snprintf(namebuff,sizeof(namebuff),"%s:%d","thread:",i+1);
pthread_create(&tid,nullptr,handler,namebuff); //
}
while(true)
{
cout << "new thread create success, I am main thread" << endl;
sleep(1);
}
return 0;
}
观察发现,线程编号不是我们预期的从1.2.3..开始的,而是到了最后一个线程名字;
而且线程确实创建出来了;
添加循环创建时sleep()函数 ;将数组地址改为拷贝
//把参数封成结构体
class ThreadData
{
public:
pthread_t tid;
char namebuffer[64];
};
void* start_routine(void* args)
{
ThreadData* td = static_cast<ThreadData*>(args);//static_cast 安全的进行强制类型转换,C++11
int cnt = 10;
while(cnt)
{
cout << "cnt:" << cnt-- << " &cnt:" << &cnt << endl;
sleep(1);
}
delete td;
return nullptr;
}
int main()
{
#define NUM 10
//创建一批线程
for(int i = 0; i < NUM; i++)
{
ThreadData* td = new ThreadData();//每次循环new的都是一个新对象
snprintf(td->namebuffer, sizeof(td->namebuffer), "%s:%d", "thread", i+1);//i+1 使线程下标从1开始
pthread_create(&td->tid, nullptr, start_routine, td);
}
//主线程
while(1)
{
cout << "new thread create success, name:main thread" << endl;
sleep(1);
}
return 0;
}
- 主线程创建新线程太快了,新线程都没有机会运行,主线程就把10个新线程创建完毕了,
- 而传参namebuffer传过去的是 缓冲区namebuffer的起始地址,
- 第十个线程创建完成之后,缓冲区的内容都被第十个线程的编号内容覆盖了,所以第一次现象线程的编号都是 10
独立栈结构
线程栈主要用于存储线程的局部变量、函数参数以及调用堆栈。当一个线程开始执行时,它的栈空间会被初始化,并且随着线程的执行,栈空间会被动态地扩展或收缩。
//把参数封成结构体
class ThreadData
{
public:
pthread_t tid;
char namebuffer[64];
};
void* start_routine(void* args)
{
ThreadData* td = static_cast<ThreadData*>(args);//static_cast 安全的进行强制类型转换,C++11
int cnt = 10;
while(cnt)
{
cout << "cnt:" << cnt-- << " &cnt:" << &cnt << endl;
sleep(1);
}
delete td;
return nullptr;
}
int main()
{
#define NUM 10
//创建一批线程
for(int i = 0; i < NUM; i++)
{
ThreadData* td = new ThreadData();//每次循环new的都是一个新对象
snprintf(td->namebuffer, sizeof(td->namebuffer), "%s:%d", "thread", i+1);//i+1 使线程下标从1开始
pthread_create(&td->tid, nullptr, start_routine, td);
}
//主线程
while(1)
{
cout << "new thread create success, name:main thread" << endl;
sleep(1);
}
return 0;
}
在函数内部定义的变量叫局部变量,具有临时性,在多线程的情况下依旧适用,因为每个线程都有自己的独立栈结构
获取线程ID
常见获取线程ID的方式有两种:
- 创建线程时通过输出型参数获得
- 通过调用pthread_self函数获得
pthread_self
void* start_routine(void* args)
{
//安全转换
std::string name = static_cast<const char*>(args);
while(true)
{
std::cout<<name<<" running ...,ID: "<<pthread_self()<<std::endl;
sleep(1);
}
}
int main()
{
pthread_t thread_id;
//创建一个线程
pthread_create(&thread_id,nullptr,start_routine,(void*)"thread 1:");
//打印一下主线程的ID
while(true)
{
std::cout<<"main thread"<<" ID: "<<pthread_self()<<std::endl;
sleep(1);
}
// 等待子线程结束
pthread_join(thread_id, NULL);
return 0;
}
线程终止
如果需要只终止某个线程而不终止整个进程
可以有三种方法:
- 从线程函数return。这种方法对主线程不适用,从main函数return相当于调用exit,整个进程退出
- 线程可以调用 pthread_ exit 终止自己
- 一个线程可以调用 pthread_ cancel 终止同一进程中的另一个线程
return终止线程
在多线程程序中,return关键字的使用有所不同
当非主线程时,仅表示该线程将终止其执行;在main函数中使用return则意味着整个进程将退出,这会导致进程的所有资源被释放。
用例
主线程创建多个新线程后,休眠2秒,然后进行return,那么整个进程也就退出了
class ThreadData
{
public:
pthread_t tid;
char namebuffer[64];
};
void* start_routine(void* args)
{
ThreadData* td = static_cast<ThreadData*>(args);//static_cast 安全的进行强制类型转换,C++11
int cnt = 10;
while(cnt)
{
cout << "new thread create success, name:" << td->namebuffer << " cnt:" << cnt-- << endl;
sleep(1);
}
delete td;
return nullptr;
}
int main()
{
#define NUM 3
//创建一批线程
for(int i = 0; i < NUM; i++)
{
ThreadData* td = new ThreadData();
snprintf(td->namebuffer, sizeof(td->namebuffer), "%s:%d", "thread", i+1);//i+1 使线程下标从1开始
pthread_create(&td->tid, nullptr, start_routine, td);
}
//主线程
cout << "new thread create success, name:main thread" << endl;
sleep(2);//主线程两秒后退出
return 0;
}
如果非主线程执行到return,仅代表该线程结束,线程退出
pthread_exit
函数终止线程
- exit 是用来终止进程的,任何一个执行流调用 exit,都会使整个进程退出;
- pthread_exit函数的功能就是终止线程;
注意
当pthread_exit()和return时,如果返回值是一个指针,该指针指向的内存空间应该是全局的或者malloc分配的(new 本质也是malloc),防止后面有其它线程通过该指针访问出错;
当然,为了避免潜在威胁,最好确保返回的指针是指向全局,malloc开辟的。这样可以确保即使线程退出,其他线程仍然可以安全地访问这些内存。不能在线程函数的栈上分配,因为当其它线程得到这个返回指针时线程函数已经退出了 ;
pthread_cancel
函数取消线程
// 定义一个用于存储线程数据的类
class ThreadData
{
public:
int number; // 线程编号
pthread_t tid; // 线程ID
char namebuffer[64]; // 缓冲区,用于存储线程名称
};
// 线程函数
void* start_routine(void* args)
{
ThreadData* td = static_cast<ThreadData*>(args);
int cnt = 10;
while (cnt > 0)
{
cout << td->namebuffer << " cnt:" << cnt-- << endl;
sleep(1);
}
// 使用 pthread_exit 返回线程编号
pthread_exit((void*)td->number);
}
int main()
{
vector<ThreadData*> threads; // 用于存储线程数据的向量
#define NUM 5 // 定义要创建的线程数量
for (int i = 0; i < NUM; i++) // 创建一批线程
{
ThreadData* td = new ThreadData(); // 创建 ThreadData 实例
td->number = i + 1; // 设置线程编号
snprintf(td->namebuffer, sizeof(td->namebuffer), "%s:%d", "thread", td->number);
pthread_create(&td->tid, nullptr, start_routine, td);
threads.push_back(td); // 把每个线程的信息 push 到 threads 向量中
}
// 主线程
for (auto& iter : threads)
{
// 输出创建成功的线程信息
cout << "create thread: " << iter->namebuffer << " : " << iter->tid << " success" << endl;
}
sleep(5); // 主线程休眠5秒
// 取消线程
for (auto& iter : threads)
{
// 取消线程
pthread_cancel(iter->tid);
cout << "pthread_cancel: " << iter->namebuffer << endl;
}
// 等待线程结束
for (auto& iter : threads)
{
void* ret = nullptr;
int n = pthread_join(iter->tid, &ret); // 等待线程结束,并获取线程返回值
// 断言
assert(n == 0);
// 输出线程结束的信息和线程退出时返回的值
cout << "join: " << iter->namebuffer << " success, thread_exit_code: " << (long long)ret << endl;
delete iter; // 释放 ThreadData 实例
}
// 主线程退出
cout << "main thread quit" << endl;
return 0;
}
一个线程被取消,它的退出码是 -1
线程等待
线程跟进程一样,创建后也需要主线程等待回收,如果主线程不对新线程进行等待,如果主线程不对新创建的线程进行等待,那么这个新线程的资源将不会被及时回收。这会导致类似“僵尸进程”的问题,也就是内存泄漏 ;
- 已经退出的线程,其空间没有被释放,仍然在进程的地址空间内。
- 创建新的线程不会复用刚才退出线程的地址空间
退出码问题
- void* retval 和 void** retval 有什么关系??
- 线程函数start_routine函数的返回值类型也是 void*, start_routine函数的返回值返回到哪里??
- 我们怎么获取线程的退出码,即线程的返回值??
pthread_join函数的参数 void** retval 是一个输出型参数,用来获取线程函数结束时,返回的退出结果
void** retval 是用来获取线程函数返回的退出结果,因为线程函数的返回值是 void*,所以需要用 void** 来接受 void*
注意:线程函数返回的退出结果是返回在线程库当中,参数 void** retval 需要去线程库里面接受才可以返回
线程分离
新创建的线程是 joinable(可以被等待)的。这意味着线程退出后,需要对其执行 pthread_join 操作来释放资源,否则这些资源将不会被释放,从而可能导致系统资源泄漏。如果不关心线程的返回值的话,线程等待pthread_join是一种负担;
可以使用 pthread_detach来分离线程。分离后的线程会在退出时自动释放其资源,无需主线程进行 pthread_join操作。
测试
// 将线程ID转换为字符串
string changeID(const pthread_t& thread_id)
{
char tid[128];
// 将线程ID格式化为十六进制字符串
snprintf(tid, sizeof(tid), "0x%x", thread_id);
return tid;
}
// 线程函数
void* start_routine(void* args)
{
string threadname = static_cast<const char*>(args);
int cnt = 5;
while (cnt > 0)
{
// 输出线程名称和线程ID
cout << threadname << " running..., threadID:" << changeID(pthread_self()) << endl;
sleep(1);
cnt--;
}
// 线程函数结束
return nullptr;
}
int main()
{
pthread_t tid;
// 创建一个新线程
pthread_create(&tid, nullptr, start_routine, (void*)"thread 1");
// 分离线程
pthread_detach(tid); // 分离线程后,线程将在退出时自动释放资源
// 线程默认是 joinable 的,一旦分离,就不允许再使用 pthread_join
// pthread_join(tid, nullptr); // 这里如果尝试使用 pthread_join 会引发错误
// 获取主线程ID
string mainID = changeID(pthread_self()); // 主线程ID
while (1)
{
// 输出主线程的信息 由于新线程已经被分离,其ID实际上已经不再有效,只是为了展示。
cout << "main running..., mainID:" << mainID << ", new threadID:" << changeID(tid) << endl;
sleep(1);
}
return 0;
}
线程ID及地址空间布局
pthread_create函数会产生一个线程ID,存放在第一个参数指向的地址中。该线程ID和前面说的线程ID不是一回事。
前面讲的线程ID属于进程调度的范畴。因为线程是轻量级进程,是操作系统调度器的最小单位,所以需要一个数值来唯一表示该线程。
pthread_create函数第一个参数指向一个虚拟内存单元,该内存单元的地址即为新创建线程的线程ID,属于NPTL线程库的范畴。线程库的后续操作,就是根据该线程ID来操作线程的。
用户级线程:线程ID值就是库中结构体(TCB)对象的地址