Linux之线程(1)

12 篇文章 0 订阅
11 篇文章 0 订阅

今天讲下Linux线程这块的知识,我想很多人应该都知道多线程的重要性,现在多线程被运用在项目中的次数越来越多,而且面试中多线程也是必问的,所以要引起我们足够的重视将这块的知识学扎实。

1.线程的概念

在说线程之前我们不得不提到进程,从用户角度来说:进程是运行中的程序;操作系统角度来说:进程是操作系统对运行中程序的描述信息–进程描述符–pcb。
线程:在一个程序里的一个执行路线
或者说是:线程是一个进程内部的控制序列
而在Linux中没有为线程设计一个tcb来控制线程运行,而是以进程的pcb来模拟实现线程,也就是说Linux下pcb实际是一个线程,线程是进程pcb的模拟实现,因此Linux的线程也叫做轻量级进程(在Linux系统中,在CPU眼中看到的pcb都要比传统的进程更轻量级),这也就是为什么Linux下多提到的是线程,Linux下进程实际是一个线程组—当中包含一个/多个线程。

因为CPU调度程序运行是调度pcb,因此线程是CPU调度的基本单位。
因为一个程序运行起来就会分配大量的资源给线程组,因此进程是资源分配的基本单位。

同一个进程的线程之间独有的数据:

  1. 寄存器
  2. errno
  3. 信号频闭字
  4. 线程标识符

同一个进程的线程之间共享的数据:

  1. 数据段,代码段
  2. 文件描述符表
  3. 信号的处理方式
  4. 工作路径
  5. 用户id,组id

2.线程控制

POSIX线程库
想使用以下函数必须引入头文件<pthread.h>
链接这些线程函数库时要使用编译器命令的“-lpthread”选项
1.线程创建
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
void *(*start_routine) (void *), void *arg);
thread:用于获取新创建的线程id
attr:线程属性,通常是置NULL
start_routine: 线程的入口函数
arg:传递给线程的参数
返回值:0 失败:!0

2.线程终止
void pthread_exit(void *retval)
retval:用于获取线程退出的返回值

int pthread_cancel(pthread_t thread)
取消一个指定线程,属于被动推出
thread:指定线程的id
主线程退出,进程并不会

3.线程等待
int pthread_join(pthread_ pthread,void **retval);
等待一个线程退出
前提:这个被等待的线程必须是joinable状态的
thread:指定线程id
retval:用于获取线程退出原因
返回值:0 失败:!0

4.线程分离
int pthread_detach(pthread_t thread);
分离一个线程(设置线程的属性从joinable->detach),线程退出后系统将自动回收资源,被分离的线程无法被等待,若是非要用pthread_join则会直接报错返回。
thread:指定分离的线程id
返回值:0 失败:!0
线程默认的属性是joinable

3.线程ID和进程ID对比

进程pid: getpid()
线程tid: pthread_self() //进程内唯一,但是在不同进程则不唯一。
线程pid: syscall(SYS_gettid) //系统内是唯一的(头文件为<sys/syscall.h>)

下面通过一个程序来看三者的区别:

  1 #include<stdio.h>
  2 #include<stdlib.h>
  3 #include<pthread.h>
  4 #include<sys/syscall.h>
  5 
  6 void* pth_start(void* arg)
  7 {
  8     printf("main getpid()=%d,syscall()=%ld,pthread_self()=%ld\n",getpid(),(long int)syscall(SYS_gettid),pthread_self());
  9     while(1){
 10         sleep(2);
 11     }
 12     return NULL;
 13 }
 14 
 15 int main()
 16 {
 17     printf("main getpid()=%d,syscall()=%ld,pthread_self()=%ld\n",getpid(),(long int)syscall(SYS_gettid),pthread_self());
 18     pthread_t tid;
 19     int ret = pthread_create(&tid,NULL,pth_start,NULL);
 20     if(ret!=0){
 21         printf("pthread create error!\n");
 22         return -1;
 23     }
 24     else{
 25         printf("child tid = %ld\n",tid);
 26     }
 27     while(1){
 28         sleep(2);
 29     }
 30     return 0;
 31 }

运行结果如下:
在这里插入图片描述
第一行结果是主线程输出的,后面那行是新线程输出的,可以看到,pid值是一样的,因为同属于一个进程,所以getpid()值是一样的,syscall()的值两个线程是不一样的,而主线程的syscall()和进程的pid值一样,这是因为主线程的pid和线程组的pid值一样,因此也就和进程的pid值一样了,前面的两个pid是在用户态层面来说的,而后面这个pthred_self()是从内核态角度来说的,也是唯一表示线程的id值,pthread_create函数第一个参数指向一个虚拟内存单元,该内存单元的地址即为新创建线程的线程ID,属于 NPTL线程库的范畴。线程库的后续操作,就是根据该线程ID来操作线程的。

为什么syscall()和pthread_self()都求的是线程id为什么会不一样呢?
因为线程库实际由两部分组成:内核的线程支持+用户态的库支持(glibc), Linux早期内核不支持线程的时候glibc就在库中(用户态)以纤程(即用户态线程)的方式支持多线程了,POSIX thread只要求了用户编程的调用接口对内核接口没有要求。
linux上的线程实现就是在内核支持的基础上以POSIX thread的方式对外封装了接口,所以才会有两个ID的问题。

强调一下,线程和进程不一样,进程有父进程的概念,但在线程组里面,所有的线程都是对等关系!

4.线程的优缺点

优点:
1)创建一个新线程的代价要比创建一个新进程小得多
2)与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少的多
3)线程占用的资源要比进程少很多
4)能充分利用多处理器的可并行数量
5)计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
6)I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。
缺点:
性能损失
一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型 线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指
的是增加了额外的 同步和调度开销,而可用的资源不变。

健壮性降低
编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了 不该共享的变量而造成不良影响的可能性是很大的,换句话说线程之间是缺乏保护的。

缺乏访问控制
进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。

编程难度提高
编写与调试一个多线程程序比单线程程序困难得多。

上面多次提到线程导致的安全问题,下节我将会讲解线程安全以及实例!

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值