Linux下线程
线程概念
什么是线程
- 在一个程序里的一个执行卢西安诺就叫线程(thread);更准确的定义:线程是“是一个进程内部的控制序列”。
- 一切进程只有都有个一个执行线程。
- 线程在进程内部运行,本质是在进程地址空间内运行。
- 在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化
- 透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配个每个执行流,就形成了线程执行流。
线程的优点
- 创建一个新线程的代价要比创建一个新进程小的多;
- 与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多;
- 线程占用的资源要比进程少很多;
- 能充分利用多处理器的可并行数量;
- 在等待慢速I/O操作结束的同时,程序可执行其他的计算任务;
- 计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现;
- I/O密集型应用,为了提高性能,将I/O操重叠;线程可以同时等待不同的I/O操作;
线程的缺点
- 性能缺失
- 一个很少被外部事件阻塞的计算机密集型线程往往无法与其它线程共享一个处理器如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失值得是增加了额外的同步和调度开销,而可用的资源不变。
- 健壮性降低
- 编写多线程需要更全面深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性很大的,即线程之间是缺乏保护的。
- 缺乏访问控制
- 进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。
- 编程难度提高
- 编写与调试一个多线程程序比单线程程序困难的多。
线程异常
- 单个线程如果出现除零,野指针问题导致线程崩溃,进程也会随着崩溃;
- 线程是进程的分支,线程异常,就类似进程异常,进而出发信号机制,终止进程,进程终止,该进程内的所有线程也就随即推出;
线程用途
- 合理的使用线程,能提高CPU密集型程序的执行效率;
- 合理的使用多线程,能提高IO密集型程序的用户体验;例如:程序员一边写着代码一边下载开发工具,就是多线程运行的一种表现;
线程控制
POSIX线程库
- 与线程有关的函数构成了一个完整的系列,绝大多数函数的名字都是以“pthread_”打头的;
- 要使用这些函数库,要通过引入头文件<pthread.h>;
- 链接这些线程函数库时要使用编译命令的“-lpthread”选项;
创建线程
功能:创建一个新的线程
原型:int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine)(void *), void *arg);
参数:
- thread:返回线程ID
- attr:设置线程属性,attr为NULL表示使用默认属性
- start_routine:是个函数地址,线程启动后要执行的函数
- arg:传给线程启动函数的参数
返回值:成功返回0,失败返回错误码
注意:
- 传统的一些函数是,成功返回0,失败返回-1,并且对全局变量errno赋值以指示错误;
- pthreads函数出错时不会设置全局变量errno(大部分其它POSIX函数会这样做);而是将错误代码通过返回值返回;
- pthreads同样提供了线程内的errno变量,以支持其它使用errno的代码;对于pthreads函数的错误,建议同样通过返回值来判定,因为读取返回值要比读取线程内的errno变量的开销小;
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <pthread.h>
void *rout(void *arg) {
int i;
for( ; ; ) {
printf("I'am thread 1\n");
sleep(1);
}
}
int main( void )
{
pthread_t tid;
int ret;
if ( (ret=pthread_create(&tid, NULL, rout, NULL)) != 0 ) {
fprintf(stderr, "pthread_create : %s\n", strerror(ret));
exit(EXIT_FAILURE);
}
int i;
for(; ; ) {
printf("I'am main thread\n");
sleep(1);
}
}
线程ID及进程地址空间布局
- pthread_create函数会产生一个线程ID,存放在第一个参数指向的地址中;该线程的ID不同于上面提到的线程ID;
- 上面提到的线程ID属于进程调度的范畴,因为线程是轻量级进程,是操作系统调度的最小单位,所以需要一个数值来唯一表示该进程。
- pthread_create函数第一个参数只想一个虚拟内存单元,该内存单元的地址即为新创建线程的线程ID,属于NPTL线程范畴,线程的后续操作就是根据该线程ID来操作线程的。
- 线程库NPTL提供了pthread_self函数,可以获得线程自身的ID:
pthread_t pthread_self(void);
//pthread_t 到底是什么类型?取决于实现,对于Linux目前实现的NPTL实现而言,
//本质就是一个进车给地址空间上的一个地址。
线程终止
如果只需要终止某个线程而不终止整个进程,可以有三种方法:
- 从线程函数return;这种方法对主线程不适用,从main函数return相当于调用exit。
- 线程可以调用pthread_exit终止自己。
- 一个线程可以调用pthread_cancel终止同一个进程中的另一个进程。
pthread_exit函数
功能:线程终止
原型:void pthread_exit(void *value_ptr)
参数:value_ptr:value_ptr不要只想一个局部变量
返回值:无返回值,和进程一样,线程结束的时候无法返回到它的调用者(自身)
注意:pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的,不能在线程函数的栈上分配,因为当其它线程得到这个返回指针时线程函数已经退出了
。
pthread_cancel函数
功能:取消一个执行中的线程
原型:int pthread_cancel(pthred_t pthread);
参数:thread:线程ID
返回值:成功返回0,失败返回错误码
线程等待
为什么需要线程等待?
- 已经退出的线程,其空间没有被释放,仍然在进程的地址空间内;
- 创建新的线程不会复用方才退出线程的地址空间;
功能:等待线程结束
原型:int pthread_join(pthread_t pthrea, void **value_ptr);
参数:
- thread:线程ID
- value_ptr:它指向一个指针,后者指向线程的返回值
返回值:成功返回0,失败返回错误码
调用该函数的线程将挂起等待,找到id为thread的线程终止;thread线程以不同的方法终止,通过pthread_join得到的终止状态时不同的
- 1.如果thread线程通过return返回,value_ ptr所指向的单元里存放的是thread线程函数的返回值。
- 2.如果thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数
PTHREAD_ CANCELED。 - 3.如果thread线程是自己调用pthread_exit终止的,value_ptr所指向的单元存放的是传给pthread_exit的参数。
- 4.如果对thread线程的终止状态不感兴趣,可以传NULL给value_ ptr参数。
分离线程
- 默认情况下,新创建的线程是joinable的,线程退出后,需要对其进行pthread_join操作,否则无法释
放资源,从而造成系统泄漏。 - 如果不关心线程的返回值,join是一种负担,这个时候,我们可以告诉系统,当线程退出时,自动释放
线程资源。
int pthread_detch(pthread_t thread);
可以是线程组内其他线程对目标线程进行分离,也可以是线程自己分离:
pthread_detch(pthread_selt())
joinable和分离是冲突的,一个线程不能既是joinable又是分离的;
线程池
- 一种线程使用模式。线程过多会带来调度开销,进而影响缓存局部性和整体性能。而线程池维护着多个线
程,等待着监督管理者分配可并发执行的任务。这避免了在处理短时间任务时创建与销毁线程的代价。线程池不仅能够保证内核的充分利用,还能防止过分调度。可用线程数量应该取决于可用的并发处理器、处理器内核、内存、网络sockets等的数量。 - 线程池的应用场景:
- 1.需要大量的线程来完成任务,且完成任务的时间比较短。 WEB服务器完成网页请求这样的任务,使用线
程池技术是非常合适的。因为单个任务小,而任务数量巨大,你可以想象一个热门网站的点击次数。 但对于长时间的任务,比如一个Telnet连接请求,线程池的优点就不明显了。因为Telnet会话时间比线程的创建时间大多了。 - 2. 对性能要求苛刻的应用,比如要求服务器迅速响应客户请求。
- 3. 接受突发性的大量请求,但不至于使服务器因此产生大量线程的应用。突发性大量客户请求,在没有线
程池情况下,将产生大量线程,虽然理论上大部分操作系统线程数目最大值不是问题,短时间内产生大量线程可能使内存到达极限,出现错误.
- 1.需要大量的线程来完成任务,且完成任务的时间比较短。 WEB服务器完成网页请求这样的任务,使用线
线程安全的单例模式
单例模式
单例模式是一种 “经典的, 常用的, 常考的” 设计模式。
- 单例模式的特点
某些类, 只应该具有一个对象(实例), 就称之为单例.
在很多服务器开发场景中, 经常需要让服务器加载很多的数据 (上百G) 到内存中. 此时往往要用一个单例的类来管理这些数据。 - 单例模式的优点:
(1)实例控制:单例模式会阻止其他对象实例化其自己的单例对象的副本,从而确保所有对象都访问唯一实例。
(2)灵活性:因为类控制了实例化过程,所以类可以灵活更改实例化过程。 - 单例模式的缺点:
(1)开销:虽然数量很少,但如果每次对象请求引用时都要检查是否存在类的实例,将仍然需要一些开销。可以通过使用静态初始化解决此问题。
(2)可能的开发混淆:使用单例对象(尤其在类库中定义的对象)时,开发人员必须记住自己不能使用new关键字实例化对象。因为可能无法访问库源代码,因此应用程序开发人员可能会意外发现自己无法直接实例化此类。
饿汉方式和懒汉方式
- 饿汉式是线程安全的,在类创建的同时就已经创建好一个静态的对象供系统使用,以后不在改变。懒汉式如果在创建实例对象时不加上synchronized则会导致对对象的访问不是线程安全的。
- 从实现方式来讲他们最大的区别就是懒汉式是
延时加载
,他是在需要的时候才创建对象,而饿汉式在虚拟机启动的时候就会创建,饿汉式无需关注多线程问题,写法简单明了,能用则用。但是它是加载类时创建实例。所以如果是一个工厂模式,缓存了很多实例,那么就得考虑效率问题,因为这个类一加载则把所有实例不管用不用一块创建。 - 两者建立单例对象的时间不同。“懒汉式”是在你真正用到的时候才去建这个单例对象,“饿汉式”是在不管用不用得上,一开始就建立这个单例对象。
设计模式
IT行业这么火, 涌入的人很多. 俗话说林子大了啥鸟都有. 大佬和菜鸡们两极分化的越来越严重. 为了让菜鸡们不太拖大佬的后腿, 于是大佬们针对一些经典的常见的场景, 给定了一些对应的解决方案, 这个就是 设计模式。