一、线程的概念
首先要明白几个概念:
1.线程在进程的地址空间执行
2.线程是进程的执行分支,每个线程都拥有进程的一部分资源。
3.线程是调用的基本单位,
进程是分配资源的基本单位
4.Linux下的进程叫做轻量级进程,因为每个进程都可以看成线程
5.Linux下没有真正的意义上的线程(它是用进程模拟的)
线程在进程的地址空间上运行,则线程一定有和进程共享的资源,共享的资源有:
1. 文件描述符表
2. 每种信号的处理方式(SIG_IGN、SIG_DFL或者自定义的信号处理函数)
3. 当前工作目录
4. 用户id和组id
线程除了有共享进程的部分内容,还有自己私有的部分,每个线程都下面一份资源:
1.线程id;
2. 上下文,包括各种寄存器的值、程序计数器和栈指针
3. 栈空间
4. errno变量
5. 信号屏蔽字
6. 调度优先级
我们将要学习的线程库函数是由POSIX标准定义的,称为POSIX thread或者pthread。在Linux
上线程函数位于libpthread共享库中,因此在编译时要加上-lpthread选项。
二、线程与进程的区别、线程的特点
1.线程是系统调用的基本单位,而进程是承担分配资源的基本单位。
2.线程属于进程的一个执行分支,则进程可以认为是只有一个执行分支的线程,所以Liunx下进程叫做轻量级进程。
3.由于同属一个进程的线程之间的代码和数据段是共享的,则线程之间通信是很容易的。
4.
由于线程是在一个进程内部运行的,所以线程的pid和组id是相同的,但是线程的id是不同的。
5.一般创建出来的线程的优先级都是平等的。
6.进程强调独立,线程强调共享。
线程的特点:成本小,调用快,但是不稳定。一个线程出现问题,整个进程都会出现问题,其他线程都会挂掉。任何一个线程有exit或者_exit,则所有线程都终止。
三、线程控制
系统已经为我们把函数分装在 pthread.h 文件里, 我们直接调动就好了,下面看看都有什么函数
1.线程的创建
(1)原形:
#include <pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
void *(*start_routine) (void *), void *arg );
Compile and link with -pthread.
(2)返回值:成功返回0,失败返回错误号。以前学过的系统函数都是成功返回0,失败返回-1,而错误 号保存在全局变量errno中,而pthread库的函数都是通过返回值返回错误号,虽然每个线程也都 有一个errno,但这是为了兼容其它函数接口而提供的,pthread库本身并不使用它,通过返回值 返回错误码更加清晰。
(3)参数:thread, 线程id, 输出型参数,attr:线程属性,start_routine:函数指针; arg:传给函数的参数
(4)错误信息:由于pthread_create的错误码不保存在errno中,因此不能直接用perror(ret)打印错误信息,可以先 用strerror(ret)把错误码转换成错误信息再打印。
2.终止线程
如果需要只终止某个线程而不终止整个进程,可以有三种方法:
1. 从线程函数return。这种方法对主线程不适用,从main函数return相当于调用exit。
2. 一个线程可以调用pthread_cancel终止同一进程中的另一个线程。
3. 线程可以调用pthread_exit终止自己。
关于pthread_exit
#include<pthread.h> void pthread_exit(void *retval);
retval是void *类型,它是一个输出型参数,是一个输入的字串(一般是退出原因),其它线程可以调用pthread_join获得这个指针。(因为retval是线程等待中用户定义的指针,用来存储被等待线程的返回值。)
需要注意:pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用 malloc分 配的,不能在线程函数的栈上分配,因为当其它线程得到这个返回指针时线程函数已 经退出了。
3.线程等待
一个线程创建后,如果不回收会这么样? 会如图僵尸进程一般(再一次证明线程是用进程所模拟的);
int pthread_join(pthread_t thread, void **retval);
调用该函数的线程将挂起等待,直到id为thread的线程终止。
成功返回0,失败返回错误号。
thread线程以不同的方法终止,通 过pthread_join得到的终止状态是不同的,总结如下:
1. 如果thread线程通过return返回,retval: 用户定义的指针,用来存储被等待线程的返回值。(获取线程的终止信息)
2. 如果thread线程被别的线程调用pthread_cancel异常终掉,retval所指向的单元里存放 的是常数PTHREAD_CANCELED。 (Linux下是-1)
3. 如果thread线程是自己调用pthread_exit终止的,retval所指向的单元存放的是传给 pthread_exit的参数。 如果对thread线程的终止状态不感兴趣,可以传NULL给retval 参数。
下面三种线程终止和等待的验证代码:
4.打印线程id
pthread_t pthread_self();
5.打印错误码:
strerror(err);
四、线程分离
1,在任何一个时间点上,线程是可结合的(joinable)或者是分离的(detached)。
2,一个可结合的线程能够被其他线程收回其资源和杀死。在被其他线程回收之前,它的存储器资源 (例如栈)是不释放的。
3,一个分离的线程是不能被其他线程回收或杀死的,它的存储器资源在它终止时由系统自动释放。
4,默认情况下,线程被创建成可结合的。为了避免存储器泄漏,每个可结合线程都应该要
么被显示地回收,即调pthread_join;要么通过调用pthread_detach函数被分离。
5,如果一个可结合线程结束运行但没有被join,则它的状态类似于进程中的Zombie Process,
即还有一部分资源没有被回收,所以创建线程者应该调用pthread_join来等待线程运行结
束,并可得到线程的退出代码,回收其资源。
6,由于调用pthread_join后,如果该线程没有运行结束,调用者会被阻塞,在有些情况下我
们并不希望如此。例如,在Web服务器中当主线程为每个新来的连接请求创建一个子线程进
行处理的时候,主线程并不希望因为调用pthread_join而阻塞(因为还要继续处理之后到来
的连接请求),这时可以在子线程中加入代码
pthread_detach(pthread_self())
或者父线程调用
pthread_detach(thread_id)(非阻塞,可立即返回)
这将该子线程的状态设置为分离的(detached),如此一来,该线程运行结束后会自动释
放所有资源。
主线线程分离: