作者:宋宝华 e-mail:21cnbao@21cn.com
1.简介
线程之间通信的两个基本问题是互斥和同步。
线程同步是指线程之间所具有的一种制约关系,一个线程的执行依赖另一个线程的消息,当它没有得到另一个线程的消息时应等待,直到消息到达时才被唤醒。
线程互斥是指对于共享的操作系统资源(指的是广义的“资源”,而不是
Windows
的
.res
文件,譬如全局变量就是一种共享资源),在各线程访问时的排它性。当有若干个线程都要使用某一共享资源时,任何时刻最多只允许一个线程去使用,其它要使用该资源的线程必须等待,直到占用资源者释放该资源。
线程互斥是一种特殊的线程同步。
实际上,互斥和同步对应着线程间通信发生的两种情况:
(
1
)当有多个线程访问共享资源而不使资源被破坏时;
(
2
)当一个线程需要将某个任务已经完成的情况通知另外一个或多个线程时。
在
WIN32
中,同步机制主要有以下几种:
(
1
)事件
(Event);
(
2
)信号量
(semaphore);
(
3
)互斥量
(mutex);
(
4
)临界区
(Critical section)
。
2.全局变量
因为进程中的所有线程均可以访问所有的全局变量,因而全局变量成为
Win32
多线程通信的最简单方式。例如:
int var; //
全局变量
UINT ThreadFunction(LPVOIDpParam)
{
var = 0;
while (var < MaxValue)
{
//
线程处理
::InterlockedIncrement(long*) &var);
}
return 0;
}
请看下列程序:
int globalFlag = false;
DWORD WINAPI ThreadFunc(LPVOID n)
{
Sleep(2000);
globalFlag = true;
return 0;
}
int main()
{
HANDLE hThrd;
DWORD threadId;
hThrd = CreateThread(NULL, 0, ThreadFunc, NULL, 0, &threadId);
if (hThrd)
{
printf("Thread launched\n");
CloseHandle(hThrd);
}
while (!globalFlag)
;
printf("exit\n");
}
上述程序中使用全局变量和
while
循环查询进行线程间同步,实际上,这是一种应该避免的方法,因为:
(
1
)当主线程必须使自己与
ThreadFunc
函数的完成运行实现同步时,它并没有使自己进入睡眠状态。由于主线程没有进入睡眠状态,因此操作系统继续为它调度
C P U
时间,这就要占用其他线程的宝贵时间周期;
(
2
)当主线程的优先级高于执行
ThreadFunc
函数的线程时,就会发生
globalFlag
永远不能被赋值为
true
的情况。因为在这种情况下,系统决不会将任何时间片分配给
ThreadFunc
线程。
3.事件
事件
(Event)
是
WIN32
提供的最灵活的线程间同步方式,事件可以处于激发状态
(signaled or true)
或未激发状态
(unsignal or false)
。根据状态变迁方式的不同,事件可分为两类:
(
1
)手动设置:这种对象只可能用程序手动设置,在需要该事件或者事件发生时,采用
SetEvent
及
ResetEvent
来进行设置。
(
2
)自动恢复:一旦事件发生并被处理后,自动恢复到没有事件状态,不需要再次设置。
创建事件的函数原型为:
HANDLE CreateEvent(
LPSECURITY_ATTRIBUTES lpEventAttributes,
// SECURITY_ATTRIBUTES
结构指针,可为
NULL
BOOL bManualReset,
//
手动
/
自动
// TRUE
:在
WaitForSingleObject
后必须手动调用
ResetEvent
清除信号
// FALSE
:在
WaitForSingleObject
后,系统自动清除事件信号
BOOL bInitialState, //
初始状态
LPCTSTR lpName //
事件的名称
);
使用“事件”机制应注意以下事项:
(
1
)如果跨进程访问事件,必须对事件命名,在对事件命名的时候,要注意不要与系统命名空间中的其它全局命名对象冲突;
(
2
)事件是否要自动恢复;
(
3
)事件的初始状态设置。
由于
event
对象属于内核对象,故进程
B
可以调用
OpenEvent
函数通过对象的名字获得进程
A
中
event
对象的句柄,然后将这个句柄用于
ResetEvent
、
SetEvent
和
WaitForMultipleObjects
等函数中。此法可以实现一个进程的线程控制另一进程中线程的运行,例如:
HANDLE hEvent=OpenEvent(EVENT_ALL_ACCESS,true,"MyEvent");
ResetEvent(hEvent);
4.临界区
定义临界区变量
CRITICAL_SECTION gCriticalSection;
通常情况下,
CRITICAL_SECTION
结构体应该被定义为全局变量,以便于进程中的所有线程方便地按照变量名来引用该结构体。
初始化临界区
VOID WINAPI InitializeCriticalSection(
LPCRITICAL_SECTION lpCriticalSection
//
指向程序员定义的
CRITICAL_SECTION
变量
);
该函数用于对
pcs
所指的
CRITICAL_SECTION
结构体进行初始化。该函数只是设置了一些成员变量,它的运行一般不会失败,因此它采用了
VOID
类型的返回值。该函数必须在任何线程调用
EnterCriticalSection
函数之前被调用,如果一个线程试图进入一个未初始化的
CRTICAL_SECTION
,那么结果将是很难预计的。
删除临界区
VOID WINAPI DeleteCriticalSection(
LPCRITICAL_SECTION lpCriticalSection
//
指向一个不再需要的
CRITICAL_SECTION
变量
);
进入临界区
VOID WINAPI EnterCriticalSection(
LPCRITICAL_SECTION lpCriticalSection
//
指向一个你即将锁定的
CRITICAL_SECTION
变量
);
离开临界区
VOID WINAPI LeaveCriticalSection(
LPCRITICAL_SECTION lpCriticalSection
//
指向一个你即将离开的
CRITICAL_SECTION
变量
);
使用临界区编程的一般方法是:
void UpdateData()
{
EnterCriticalSection(&gCriticalSection);
...//do something
LeaveCriticalSection(&gCriticalSection);
}
关于临界区的使用,有下列注意点:
(
1
)每个共享资源使用一个
CRITICAL_SECTION
变量;
(
2
)不要长时间运行关键代码段,当一个关键代码段长时间运行时,其他线程就会进入等待状态,这会降低应用程序的运行性能;
(
3
)如果需要同时访问多个资源,则可能连续调用
EnterCriticalSection
;
(
4
)
Critical Section
不是
OS
核心对象,如果进入临界区的线程“挂”了,将无法释放临界资源。这个缺点在
Mutex
中得到了弥补。
5.互斥
互斥量的作用是保证每次只能有一个线程获得互斥量而得以继续执行,使用
CreateMutex
函数创建:
HANDLE CreateMutex(
LPSECURITY_ATTRIBUTES lpMutexAttributes,
//
安全属性结构指针,可为
NULL
BOOL bInitialOwner,
//
是否占有该互斥量,
TRUE
:占有,
FALSE
:不占有
LPCTSTR lpName
//
信号量的名称
);
Mutex
是核心对象,可以跨进程访问,下面的代码给出了从另一进程访问命名
Mutex
的例子:
HANDLE hMutex;
hMutex = OpenMutex(MUTEX_ALL_ACCESS, FALSE, L"mutexName");
if (hMutex){
…
}
else{
…
}
相关
API
:
BOOL WINAPI ReleaseMutex(
HANDLE hMutex
);
使用互斥编程的一般方法是:
void UpdateResource()
{
WaitForSingleObject(hMutex,…);
...//do something
ReleaseMutex(hMutex);
}
互斥
(mutex)
内核对象能够确保线程拥有对单个资源的互斥访问权。互斥对象的行为特性与临界区相同,但是互斥对象属于内核对象,而临界区则属于用户方式对象,因此这导致
mutex
与
Critical Section
的如下不同:
(1)
互斥对象的运行速度比关键代码段要慢;
(2)
不同进程中的多个线程能够访问单个互斥对象;
(3)
线程在等待访问资源时可以设定一个超时值。
下图更详细地列出了互斥与临界区的不同:
6.信号量
信号量是维护
0
到指定最大值之间的同步对象。信号量状态在其计数大于
0
时是有信号的,而其计数是
0
时是无信号的。信号量对象在控制上可以支持有限数量共享资源的访问。
信号量的特点和用途可用下列几句话定义:
(
1
)如果当前资源的数量大于
0
,则信号量有效;
(
2
)如果当前资源数量是
0
,则信号量无效;
(
3
)系统决不允许当前资源的数量为负值;
(
4
)当前资源数量决不能大于最大资源数量。
创建信号量
HANDLE CreateSemaphore (
PSECURITY_ATTRIBUTE psa,
LONG lInitialCount, //
开始时可供使用的资源数
LONG lMaximumCount, //
最大资源数
PCTSTR pszName);
释放信号量
通过调用
ReleaseSemaphore
函数,线程就能够对信标的当前资源数量进行递增,该函数原型为:
BOOL WINAPI ReleaseSemaphore(
HANDLE hSemaphore,
LONG lReleaseCount, //
信号量的当前资源数增加
lReleaseCount
LPLONG lpPreviousCount
);
打开信号量
和其他核心对象一样,信号量也可以通过名字跨进程访问,打开信号量的
API
为:
HANDLE OpenSemaphore (
DWORD fdwAccess,
BOOL bInherithandle,
PCTSTR pszName
);
7.互锁访问
当必须以原子操作方式来修改单个值时,互锁访问函数是相当有用的。所谓原子访问,是指线程在访问资源时能够确保所有其他线程都不在同一时间内访问相同的资源。
请看下列代码:
int globalVar = 0;
DWORD WINAPI ThreadFunc1(LPVOID n)
{
globalVar++;
return 0;
}
DWORD WINAPI ThreadFunc2(LPVOID n)
{
globalVar++;
return 0;
}
运行
ThreadFunc1
和
ThreadFunc2
线程,结果是不可预料的,因为
globalVar++
并不对应着一条机器指令,我们看看
globalVar++
的反汇编代码:
00401038 mov eax,[globalVar (0042d3f0)]
0040103D add eax,1
00401040 mov [globalVar (0042d3f0)],eax
在“
mov eax,[globalVar (0042d3f0)]
”
指令与“
add eax,1”
指令以及“
add eax,1”
指令与“
mov [globalVar (0042d3f0)],eax
”指令之间都可能发生线程切换,使得程序的执行后
globalVar
的结果不能确定。我们可以使用
InterlockedExchangeAdd
函数解决这个问题:
int globalVar = 0;
DWORD WINAPI ThreadFunc1(LPVOID n)
{
InterlockedExchangeAdd(&globalVar,1);
return 0;
}
DWORD WINAPI ThreadFunc2(LPVOID n)
{
InterlockedExchangeAdd(&globalVar,1);
return 0;
}
InterlockedExchangeAdd
保证对变量
globalVar
的访问具有“原子性”。互锁访问的控制速度非常快,调用一个互锁函数的
CPU
周期通常小于
50
,不需要进行用户方式与内核方式的切换(该切换通常需要运行
1000
个
CPU
周期)。
互锁访问函数的缺点在于其只能对单一变量进行原子访问,如果要访问的资源比较复杂,仍要使用临界区或互斥。
8.可等待定时器
可等待定时器是在某个时间或按规定的间隔时间发出自己的信号通知的内核对象。它们通常用来在某个时间执行某个操作。
创建可等待定时器
HANDLE CreateWaitableTimer(
PSECURITY_ATTRISUTES psa,
BOOL fManualReset,//
人工重置或自动重置定时器
PCTSTR pszName);
设置可等待定时器
可等待定时器对象在非激活状态下被创建,程序员应调用
SetWaitableTimer
函数来界定定时器在何时被激活:
BOOL SetWaitableTimer(
HANDLE hTimer, //
要设置的定时器
const LARGE_INTEGER *pDueTime, //
指明定时器第一次激活的时间
LONG lPeriod, //
指明此后定时器应该间隔多长时间激活一次
PTIMERAPCROUTINE pfnCompletionRoutine,
PVOID PvArgToCompletionRoutine,
BOOL fResume);
取消可等待定时器
BOOl Cancel WaitableTimer(
HANDLE hTimer //
要取消的定时器
);
打开可等待定时器
作为一种内核对象,
WaitableTimer
也可以被其他进程以名字打开:
HANDLE OpenWaitableTimer (
DWORD fdwAccess,
BOOL bInherithandle,
PCTSTR pszName
);
9.实例
下面给出的一个程序可能发生死锁现象:
#include <windows.h>
#include <stdio.h>
CRITICAL_SECTION cs1, cs2;
long WINAPI ThreadFn(long);
main()
{
long iThreadID;
InitializeCriticalSection(&cs1);
InitializeCriticalSection(&cs2);
CloseHandle(CreateThread(NULL, 0, (LPTHREAD_START_ROUTINE)ThreadFn, NULL, 0,
&iThreadID));
while (TRUE)
{
EnterCriticalSection(&cs1);
printf("\n
线程
1
占用临界区
1");
EnterCriticalSection(&cs2);
printf("\n
线程
1
占用临界区
2");
printf("\n
线程
1
占用两个临界区
");
LeaveCriticalSection(&cs2);
LeaveCriticalSection(&cs1);
printf("\n
线程
1
释放两个临界区
");
Sleep(20);
};
return (0);
}
long WINAPI ThreadFn(long lParam)
{
while (TRUE)
{
EnterCriticalSection(&cs2);
printf("\n
线程
2
占用临界区
2");
EnterCriticalSection(&cs1);
printf("\n
线程
2
占用临界区
1");
printf("\n
线程
2
占用两个临界区
");
LeaveCriticalSection(&cs1);
LeaveCriticalSection(&cs2);
printf("\n
线程
2
释放两个临界区
");
Sleep(20);
};
}
运行这个程序,在中途一旦发生这样的输出:
线程
1
占用临界区
1
线程
2
占用临界区
2
或
线程
2
占用临界区
2
线程
1
占用临界区
1
或
线程
1
占用临界区
2
线程
2
占用临界区
1
或
线程
2
占用临界区
1
线程
1
占用临界区
2
程序就“死”掉了,再也运行不下去。因为这样的输出,意味着两个线程相互等待对方释放临界区,也即出现了死锁。
如果我们将线程
2
的控制函数改为:
long WINAPI ThreadFn(long lParam)
{
while (TRUE)
{
EnterCriticalSection(&cs1);
printf("\n
线程
2
占用临界区
1");
EnterCriticalSection(&cs2);
printf("\n
线程
2
占用临界区
2");
printf("\n
线程
2
占用两个临界区
");
LeaveCriticalSection(&cs1);
LeaveCriticalSection(&cs2);
printf("\n
线程
2
释放两个临界区
");
Sleep(20);
};
}
再次运行程序,死锁被消除,程序不再挡掉。这是因为我们改变了线程
2
中获得临界区
1
、
2
的顺序,消除了线程
1
、
2
相互等待资源的可能性。
由此我们得出结论,在使用线程间的同步机制时,要特别留心死锁的发生。
本文转自 21cnbao 51CTO博客,原文链接:http://blog.51cto.com/21cnbao/120733,如需转载请自行联系原作者