第六章 线程基本概念
1.线程的组成
(1)线程内核对象:用于管理线程及存储线程的统计信息
(2)线程栈:维护线程执行时需要的函数参数和局部变量。 线程栈所需的内存是从进程中分配而得的,其大小默认是1M.
每个线程都有自已独立的线程栈。
进程不执行任何代码,所有的代码都是由线程执行的。进程相当于一个装载线程的容器。
线程共享进程的地址空间和数据,如内核对象句柄(内核对象句柄只能依附于某个进程而不是某个线程)
2.线程函数原型
DWORD WINAPI ThreadFunc(PVOID pvParam)
{
DWORD dwResult = 0;
...
return(dwResult);
}
The system allocates memory out of the process' address space for use by the thread's stack.
3.终止线程
1.线程正常退出。系统会对线程函数内创建的所有对象调用析构函数。
2.ExitThread(). 线程退出, 系统会清理线程栈。 但是系统不会对线程函数内创建的所有对象调用析构函数。
3.TerminateThread().线程异步退出,系统不清理线程栈。只到拥有该线程的进程退出时才清理线程栈。
该函数是个异步函数,它只会告诉系统去杀掉某个线程,但是系统不会保证当该函数返回时线程立刻终止。
因此我们如果我们要确认线程已经终止了,则需要用WaitForSingleObject()来等待线程结束。
4.内核对象由进程所拥有,用户对象由线程拥有。线程可拥有两种用户对象:Windows和Hook.
5.线程终止后,线程所拥有的用户对象会被系统释放。
6.GetExitCodeThread() //检查线程是否已终止
4.线程内部细节
1.CreateThread 和 _beginthreadex 区别:
CreateThread是系统API,_beginthreadex是CRT(C Run Time Library 运行时库)函数. _beginthreadex内部会调用CreateThread函数。
_endthreadex会释放_beginthreadex为tiddata结构分配的内存。
如果线程函数中调用了CRT函数(注:不是全部CRT函数 只是其中一部分函数),则该线程函数必须由_beginthreadex而不是CreateThread函数创建。否则会产生内存泄露。
如果在除主线程之外的任何线程中进行一下操作,你就应该使用多线程版本的C runtime library,并使用_beginthreadex和_endthreadex:
(1) 使用malloc()和free(),或是new和delete
(2) 使用stdio.h或io.h里面声明的任何函数
(3) 使用浮点变量或浮点运算函数
(4) 调用任何一个使用了静态缓冲区的runtime函数,比如:asctime(),strtok()或rand()
2._beginthreadex和_beginthread区别
_beginthreadex内部会自动调用 _endthreadex.
_beginthread内部会自动调用_endthread.
_endthread内部会自动调用CloseHandle关闭当前Thread内核对象的句柄,所以在用_beginthread 时我们不需要在主线程中调用CloseHandle来关闭子线程的句柄。
_endthreadex相比_endthread而言更安全。它不会自动关闭当前Thread内核对象的句柄。所以在用_beginthreadex时我们需要用CloseHandle来关闭子线程的句柄。
5.伪句柄和真实句柄
1.伪句柄(Pseudohandle):
HANDLE GetCurrentProcess();
HANDLE GetCurrentThread();
以上两个函数会返回指向线程或进程内核对象的伪句柄(其实以上两个函数返回的是一个常数如-1)。所以伪句柄的值永远是指向当前线程或进程的。
如果把该值传给子进程,该值则代表当前子进程的伪句柄。所以把句柄传给子线程时一定要传真时的句柄不能传伪句柄。
该句柄不会增加内核对象的引用计数,所以不需要调用CloseHandle()函数。
2.把伪句柄转换成真实句柄
DuplicateHandle会增加内核对象的引用计数,所以要用CloseHandle()来关闭复制所得的对象句柄。
6.Common API
DWORD GetCurrentProcessId();
DWORD GetCurrentThreadId();
HANDLE GetCurrentProcess();
HANDLE GetCurrentThread();
DuplicateHandle()
在 Win32 API 中,创建线程的基本函数是 CreateThread,而 _beginthread(ex) 是
C++ 运行库的函数。为什么要有两个呢?因为C++ 运行库里面有一些函数使用了全局
量,如果使用 CreateThread 的情况下使用这些C++ 运行库的函数,就会出现不安全
的问题。而 _beginthreadex 为这些全局变量做了处理,使得每个线程都有一份独立
的“全局”量。
所以,如果你的编程只调用 Win32 API/SDK ,就放心用 CreateThread;如果要用到
C++ 运行时间库,那么就要使用 _beginthreadex ,并且需要在编译环境中选择 Use
MultiThread Lib/DLL。
C++ 运行期库有两个创建线程的函数,另一个是 _beginthread, 它们两者的区别请
自己去看MSDN:
通常他们的解释都是这容易造成内存泄漏。这个解释本身是没有错的,但是解释得不够完全和详 细。以至于造成很多新手盲目的信任了那句话,在那里都是用_beginthreadex函数,或者是装作没有看到使用CreateThread函数。曾经 有一段时间我也对这个问题很是困惑,不知道到底用那个才是对的。因为我不止一次在很多权威性的代码中看到对CreateThread函数的直接调用。难道 是权威错了?? 抱着怀疑的态度查找了大量的资料和书籍,终于搞明白了这个问题的关键所在,在此做个说明,算是对那句话的一个完善。
关于_beginthreadex和CreateThread的区别我就不做说明了,这个很 容易找到的。我们只要知道一个问题:_beginthreadex是一个C运行时库的函数,CreateThread是一个系统API函 数,_beginthreadex内部调用了CreateThread。只所以所有的书都强调内存泄漏的问题是因为_beginthreadex函数在创 建线程的时候分配了一个堆结构并和线程本身关联起来,我们把这个结构叫做tiddata结构,是通过线程本地存储器TLS于线程本身关联起来。我们传入的 线程入口函数就保存在这个结构中。tiddata的作用除了保存线程函数入口地址之外,还有一个重要的作用就是:C运行时库中有些函数需要通过这个结构来 保存和获取一些数据,比如说errno之类的线程全局变量。这点才是最重要的。
当一个线程调用一个要求tiddata结构的运行时库函数的时候,将发生下面的情况:
运行时库函数试图TlsGetv alue获取线程数据块的地址,如果没有获取到,函数就会 现场分配一个 tiddata结构,并且和线程相关联,于是问题出现了,如果不通过_endthreadex函数来终结线程的话,这个结构将不会被撤销,内存泄漏就会出 现了。但通常情况下,我们都不推荐使用_endthreadex函数来结束线程,因为里面包含了ExitThread调用。
找到了内存泄漏的具体原因,我们可以这样说:只要在创建的线程里面不使用一些要求tiddata结构的运行时库函数,我们的内存时安全的。所以,前面说的那句话应该这样说才完善:
“绝对不要调用系统自带的CreateThread函数创建新的线程,而应该使用_beginthreadex,除非你在线程中绝不使用需要tiddata结构的运行时库函数”
这个需要tiddata结构的函数有点麻烦了,在侯捷的《win32多线程程序设计》一书中这样说到:
”如果在除主线程之外的任何线程中进行一下操作,你就应该使用多线程版本的C runtime library,并使用_beginthreadex和_endthreadex:
1 使用malloc()和free(),或是new和delete
2 使用stdio.h或io.h里面声明的任何函数
3 使用浮点变量或浮点运算函数
4 调用任何一个使用了静态缓冲区的runtime函数,比如:asctime(),strtok()或rand()