达者为先 师者之意
1 什么是线程
线程
什么是线程?
在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序列”。
一切进程至少都有一个执行线程。
线程是进程内部的一条执行序列或执行路径,即一个可调度的实体。一个进程可以包含多条线程。
进程— 资源分配的最小单位
线程— 程序执行的最小单位
进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其他进程产生影响,而线程只是一个进程中的不同执行路径。线程有自己的堆栈和局部变量,但线程没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮,但在进程切换时,耗费资源较大,效率要差一些,但对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。
进程是一个程序的一个实例,拥有自己独立的各种段(数据段,代码段等等),每次创建一个进程需要从操作系统分配这些资源给他,消耗一定的时间,在linux下C语言创建一个进程使用fork()函数;
线程是一个轻量级的进程,除了自己少数的资源,不用用其他资源,且一个进程可以创建多个线程,这些线程共享进程的资源,创建线程的时间要比创建进程少很多,(几十分之一),从函数角度是使用clone()创建。
使用线程处理文件I/O或者socket处理都是非常有优势的,将一个大人物分解成若干个小任务,每个线程处理一个任务,线程之间切换不需要花很多时间,而且线程之间数据交换很方便,共享存储区。
总的来说就是:进程有独立的地址空间,线程没有单独的地址空间(同一进程内的线程共享进程的地址空间)。
使用多线程的理由之一是和进程相比,它是一种非常"节俭"的多任务操作方式。我们知道,在Linux系统下,启动一个新的进程必须分配给它独立的地址空间,建立众多的数据表来维护它的代码段、堆栈段和数据段,这是一种"昂贵"的多任务工作方式。而运行于一个进程中的多个线程,它们彼此之间使用相同的地址空间,共享大部分数据,启动一个线程所花费的空间远远小于启动一个进程所花费的空间,而且,线程间彼此切换所需的时间也远远小于进程间切换所需要的时间。据统计,总的说来,一个进程的开销大约是一个线程开销的30倍左右,当然,在具体的系统上,这个数据可能会有较大的区别。
使用多线程的理由之二是线程间方便的通信机制。对不同进程来说,它们具有独立的数据空间,要进行数据的传递只能通过通信的方式进行,这种方式不仅费时,而且很不方便。线程则不然,由于同一进程下的线程之间共享数据空间,所以一个线程的数据可以直接为其它线程所用,这不仅快捷,而且方便。当然,数据的共享也带来其他一些问题,有的变量不能同时被两个线程所修改,有的子程序中声明为static的数据更有可能给多线程程序带来灾难性的打击,这些正是编写多线程程序时最需要注意的地方。
除了以上所说的优点外,不和进程比较,多线程程序作为一种多任务、并发的工作方式,当然有以下的优点:
- 提高应用程序响应。这对图形界面的程序尤其有意义,当一个操作耗时很长时,整个系统都会等 待这个操作,此时程序不会响应键盘、鼠标、菜单的操作,而使用多线程技术,将耗时长的操作(time consuming)置于一个新的线程,可以避免这种尴尬的情况。
- 使多CPU系统更加有效。操作系统会保证当线程数不大于CPU数目时,不同的线程运行于不同的CPU上。
- 改善程序结构。一个既长又复杂的进程可以考虑分为多个线程,成为几个独立或半独立的运行部分,这样的程序会利于理解和修改。
2 创建线程
函数原型
#include <pthread.h>
int pthread_create(pthread_t *tidp,const pthread_attr_t *attr, void *(*start_rtn)(void*),void *arg);
其返回值是一个整数,若创建进程成功返回0,否则,返回其他错误代码,也是正整数。
创建线程需要的参数:
- 返回值:成功返回0,否则返回出错编号,并且thread中的内容是未定义的。
- pthread_t *tidp:线程id的类型为pthread_t,通常为无符号整型,调用pthread_create成功时,通过tid指针返回。
- pthread_attr_t *attr:指定创建线程的属性,如线程优先级、初始栈大小、是否为守护进程等。可以使用NULL来使用默认值,通常情况下我们都是使用默认值。
- void *(start_rtn)(void):函数指针start_rtn,指定当新的线程创建之后,将执行的函数。
- void *arg:线程将执行的函数的参数。如果想传递多个参数,请将它们封装在一个结构体中。
当 pthread_create成功返回时,
由tidp指向的内存单元被设置为新创建线程的线程ID。
attr参数用于定制各种不同的线程属性,暂可以把它设置为NULL,以创建默认属性的线程。
新创建的线程从start_rtn函数的地址开始运行,该函数只有一个无类型指针参数arg。
如果需要向start_rtn函数传递的参数不止一个,那么需要把这些参数放到一个结构中,然后把这个结构的地址作为arg参数传入。
注意:在编译时注意加上-lpthread参数,以调用静态链接库。因为pthread并非Linux系统的默认库。
3 结束线程
函数原型:
#include <pthread.h>
void pthread_exit(void* retval);
retval 是一个无类型指针,可以指向任何类型的数据,它指向的数据将作为线程退出时的返回值。如果线程不需要返回任何数据,将 retval 参数置为NULL即可。
实现:用于终止线程,可以指定返回值,以便其他线程通过pthread_join函数获取该线程的返回值。
void* retval:指针线程终止的返回值。
4 线程等待
线程创建后怎么执行,新线程和老线程谁先执行这些不是程序来决定,而是由操作系统进行调度的,但是在编程的时候我们常常需要多个线程配合工作,比如在结束某个线程之前,需要等待另外一个线程的处理结果(返回状态等信息),这时候就需要使用线程等待函数。
函数原型:
#include <pthread.h>
int pthread_join(pthread_t thread, void **retval);
- 返回值:成功返回0,否则返回出错编号。
- pthread_t thread:表示要等待的进程的id;
- void ** retval:表示要等待的进程的返回状态,是个二级指针,如果不为NULL,那么线程的返回值存储在retval指向的空间中(这种参数也称为“值-结果”参数)。
调用这个函数的线程将一直阻塞,直到指定的线程调用pthread_exit、从启动例程中返回或者被取消。如果例程只是从它的启动例程返回i,rval_ptr将包含返回码。如果线程被取消,由retval指定的内存单元就置为PTHREAD_CANCELED。
可以通过调用pthread_join自动把线程置于分离状态,这样资源就可以恢复。如果线程已经处于分离状态,pthread_join调用就会失败,返回EINVAL。
如果对线程的返回值不感兴趣,可以把retval置为NULL。在这种情况下,调用pthread_join函数将等待指定的线程终止,但并不获得线程的终止状态。
返回当前线程ID
#include <pthread.h>
pthread_t pthread_self (void);
// 返回:调用线程的ID
对于线程ID比较,为了可移植操作,我们不能简单地把线程ID当作整数来处理,因为不同系统对线程ID的定义可能不一样。我们应该要用下边的函数:
#include <pthread.h>
int pthread_equal(pthread_t tid1, pthread_t tid2);
// 返回:若相等则返回非0值,否则返回0
代码例子
#include <stdio.h>
#include <pthread.h>
void *func1(void *arg)
{
static int ret = 13;
printf("t1:the id of the pthread is:%ld\n",(unsigned long)pthread_self());
printf("the arg is:%d\n",*((int *)arg));
pthread_exit((void *)&ret);
}
int main()
{
pthread_t t1;
int ret;
int param = 12;
int *pret = NULL;
ret = pthread_create(&t1,NULL,func1,(int *)¶m);
if(ret == 0)
{
printf("Success to create the t1 pthread\n");
}
printf("main:the id:%ld\n",(unsigned long)pthread_self());
pthread_join(t1,(void **)&pret);
printf("the pret is:%d\n",*pret);
return 0;
}
Success to create the t1 pthread
main:the id:139775874971392
t1:the id of the pthread is:139775866685184
the arg is:12
the pret is:13
用两个或两个以上的线程验证同一进程下的线程是共用内存空间的,且这时候的线程是随机输出的,即没有顺序的
代码例子
#include <stdio.h>
#include <pthread.h>
int r_data = 0;
void *func1(