进程与线程的区别
进程:
进程是程序执行时的一个实例,是担当分配系统资源(CPU时间、内存等)的基本单位。
在面向线程设计的系统中,进程本身不是基本运行单位,而是线程的容器。
程序本身只是指令、数据及其组织形式的描述。
进程才是程序(那些指令和数据)的真正运行实例。
典型的UNIX/Linux进程可以看成只有一个控制线程:一个进程在同一时刻只做一件事情。
有了多个控制线程后,在程序设计时可以把进程设计成在同一时刻做不止一件事,每个线程各自处理独立的任务。
线程:
线程是操作系统能够进行运算调度的最小单位。
它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。线程包含了表示进程内执行环境必须的信息,其中包括进程中表示线程的线程ID、一组寄存器值、栈、调度优先级和策略、信号屏蔽字、errno常量以及线程私有数据。进程的所有信息对该进程的所有线程都是共享的,包括可执行的程序文本、程序的全局内存和堆内存、栈以及文件描述符。在Unix和类Unix操作系统中线程也被称为轻量级进程(lightweight processes),但轻量级进程更多指的是内核线程(kernel thread),而把用户线程(user thread)称为线程。
进程——资源分配的最小单位,线程——程序执行的最小单位
进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径。
线程有自己的堆栈和局部变量,但线程没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮,但在进程切换时,耗费资源较大,效率要差一些。
但对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。
线程和进程的比较
线程的优点
进程有独立的地址空间,线程没有单独的地址空间(同一进程内的线程共享进程的地址空间)。
相对于进程的优点:
优点一:线程的空间开销小、线程间彼此切换时间短
它是一种非常"节俭"的多任务操作方式。我们知道,在Linux系统下,启动一个新的进程必须分配给它独立的地址空间,建立众多的数据表来维护它的代码段、堆栈段和数据段,这是一种"昂贵"的多任务工作方式。
而运行于一个进程中的多个线程,它们彼此之间使用相同的地址空间,共享大部分数据,启动一个线程所花费的空间远远小于启动一个进程所花费的空间,而且,线程间彼此切换所需的时间也远远小于进程间切换所需要的时间。据统计,总的说来,一个进程的开销大约是一个线程开销的30倍左右,当然,在具体的系统上,这个数据可能会有较大的区别。
优点二:线程间方便的通信机制
使用多线程的优点之二是线程间方便的通信机制。
对不同进程来说,它们具有独立的数据空间,要进行数据的传递只能通过通信的方式进行,这种方式不仅费时,而且很不方便。
对于线程来说,由于同一进程下的线程之间共享数据空间,所以一个线程的数据可以直接为其它线程所用,这不仅快捷,而且方便。
当然,数据的共享也带来其他一些问题,有的变量不能同时被两个线程所修改,有的子程序中声明为static的数据更有可能给多线程程序带来灾难性的打击,这些正是编写多线程程序时最需要注意的地方。
作为多任务、并发的工作方式的其他优点:
除了以上所说的优点外,不和进程比较,多线程程序作为一种多任务、并发的工作方式,当然有以下的优点:
1、提高应用程序响应。
这对图形界面的程序尤其有意义,当一个操作耗时很长时,整个系统都会等待这个操作,此时程序不会响应键盘、鼠标、菜单的操作,而使用多线程技术,将耗时长的操作(time consuming)置于一个新的线程,可以避免这种尴尬的情况。
2、使多CPU系统更加有效。
操作系统会保证当线程数不大于CPU数目时,不同的线程运行于不同的CPU上。
3、改善程序结构。
一个既长又复杂的进程可以考虑分为多个线程,成为几个独立或半独立的运行部分,这样的程序会利于理解和修改。
多线程的用处
线程开发常用API
多线程开发在 Linux 平台上已经有成熟的 pthread 库支持。
其涉及的多线程开发的最基本概念主要包含三点:1、线程,2、互斥锁,3、条件。
线程操作:
线程操作包括3 种线程的创建,退出,等待。
互斥锁:
互斥锁则包括 4 种操作,分别是创建,销毁,加锁和解锁。
条件操作:
条件操作有 5 种操作:创建,销毁,触发,广播和等待。
其他的一些线程扩展概念,如信号灯等,都可以通过上面的三个基本元素的基本操作封装出来。详细请见下表:
线程的基本操作
就像每个进程都有一个进程号一样,每个线程也有一个线程号
进程号在整个系统中是唯一的,但线程号不同,线程号只在它所属的进程环境中有效
进程号用pid_t数据类型表示,是一个非负整数,
线程号则用pthread_t数据类型表示
有的系统在实现pthread_t的时候,用一个结构体表示,所以在可移植的操作系统实现不能把它做为整数处理 ubuntu中是整数
线程的创建
#include <pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
void *(*start_routine) (void *), void *arg);
功能:
创建一个线程
参数
thread: 线程标识符地址 也就是线程的id 是地址
attr: 线程属性结构体地址 默认属性设为NULL
start_routine: 线程函数的入口地址
arg: 传给线程函数的参数 也是地址
返回值
成功:返回0
失败:返回非0
当前进程也就是主控线程
与fork不同的是pthread_create创建的线程不与父线程在同一点开始运行,而是从指定的函数开始运行,该函数运行完后,该线程也就退出了。
线程依赖进程存在的,如果创建线程的进程结束了,线程也就结束了
线程函数的程序在pthread库中,故链接时要加上参数-lpthread
线程创建
#include <pthread.h>
//由于线程库原本不是系统本身的,所以在链接时需要手动链接库文件 gcc demo.c -lpthread
#include <stdio.h>
#include <stdlib.h>
//int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
void* thread_fun (void* arg)
{
printf("子线程正在运行 \n");
}
int main()
{
printf("主控线程正在运行\n");
pthread_t thread;
//通过pthread_create创建子线程
if(pthread_create(&thread , NULL, thread_fun, NULL) != 0)
{
perror("create fail ");
exit(1);
}
while(1);
//由于进程结束后,进程中所有的线程都会强制退出,所以现阶段不要让进程退出
return 0;
}
~
执行结果:
两个线程创建
#include <unistd.h>
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
//一个线程中的多个线程执行顺序是不确定的,没有先后顺序可言
//多线程执行时跟进程一样,是来回切换运行的,跟进程的调度机制一样
//int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
void* thread_fun1 (void* arg)
{
printf("zi xian cheng 1 zheng zai yun xing\n");
sleep(1);
printf("**********************************\n");
}
void* thread_fun2 (void* arg)
{
printf("zi xian cheng 2 zheng zai yun xing\n");
sleep(1);
printf("-----------------------------------\n");
}
int main()
{
printf("zhu kong xian cheng zheng zai zhi xing\n");
pthread_t thread1, thread2;
if(pthread_create(&thread1 , NULL, thread_fun1, NULL) != 0)
{
perror("create fail ");
exit(1);
}
if(pthread_create(&thread2 , NULL, thread_fun2, NULL) != 0)
{
perror("create fail ");
exit(1);
}
while(1);
return 0;
}
线程处理函数的传参
#include <unistd.h>
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
//int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
int num = 10;
//上面定义的全局变量下面两个线程函数都可以接收到,并且线程1还可以改变它的值,所以证明线程间的通信,是简单的
//线程处理函数可以认为就是一个普通的全局函数,只不过与普通函数最大的区别
//在于线程处理函数是并行处理,来回交替执行,但是普通函数是按照顺序一个个执行的
void* thread_fun1 (void* arg)
{
printf(" 1 xiancheng num = %d\n", num);
num++;
int n = *(int*)arg;
printf("n = %d\n", n);
*(int*)arg = 111;
}
void* thread_fun2 (void* arg)
{
sleep(1);