c++ python 多线程_c++多线程调用python

最新推荐文章于 2024-08-01 09:46:25 发布

内寻读书

最新推荐文章于 2024-08-01 09:46:25 发布

阅读量790

点赞数

文章标签： c++ python 多线程

本文链接：https://blog.csdn.net/weixin_35054319/article/details/112959736

版权

本文探讨了如何在C++应用中创建线程安全的接口来调用Python解释器，详细解释了在多线程环境中使用Python的全局解释器锁（GIL），以及如何初始化、创建线程、执行Python代码和清理资源的过程。

摘要由CSDN通过智能技术生成

脚本语言是快速编写富有弹性的代码的重要方法之一，在Unix系统自动化管理中已经应用了多种脚本语言。现在，在许多应用开发中，也提供了脚本层，这大大方便用户实现通用任务自动处理或者编写应用扩展，许多成功的应用，诸如GIMP、Emacs、MS Office、PhotoShop、AutoCAD等都应用了脚本技术。在某种意义上，一切皆可脚本化。

在另一篇文章中，我们已经介绍了如何在C应用中嵌入语言，通过这项技术，可以让应用的高级用户来修改或定制化他们的程序，你可以充分利用的语言能力而不用自己去实现嵌入语言。是一个不错的的选择，因为它提供了干净直观的C语言API。关于如何在C应用中嵌入解释器，你可以参考：一文。

现在我们来更深入地探讨一些问题。鉴于许多复杂的应用都会利用多线程技术，本文将着重介绍如何创建线程安全的界面来调用Python解释器。

这里的所有例子都是用，所有的函数都以extern “C”定义，因此对于C和，其使用是别无二致的。

在C程序中创建执行线程是很简单的。在Linux中，通常的做法是使用POSIX线程(并调用pthread_create函数。关于如何使用pthreads，你可以参考Felix Garcia和Javier Fernandez著的一文。为了支持多线程，使用了互斥使访问内部数据结构串行化。这种互斥即“全局解释器锁– global interpreter lock”，当某个线程想使用的C API的时候，它必须获得全局解释器锁，这避免了会导致解析器状态崩溃的竞争条件(race condition)。

互斥的锁定和释放是通过PyEval_AcquireLock和Eval_ReleaseLock来描述的。调用了PyEval_AcquireLock之后，可以安全地假定你的线程已经持有了锁，其他相关线程不是被阻塞就是在执行与解析器无关的代码。现在你可以任意调用函数了。一旦取得了锁，你必须确保调用PyEval_ReleaseLock来释放它，否则就会导致线程死锁并冻结其他线程。

更复杂的情况是，每个运行的线程维护着自己的状态信息。这些和特定线程相关的数据存储在称为PyThreadState的对象中。当在多线程应用中用C语言调用函数时，你必须维护自己的PyThreadState对象以便能安全地执行并发的代码。

如果你对开发多线程应用相当有经验，你可能会发现全局解释器锁的概念相当不方便。不过，现在它已经不像首次出现时那样糟糕了。当对脚本进行解释时，它会定期切换出当前PyThreadState对象并释放全局解释器锁，从而将控制权释放给其他线程。之前被阻塞的线程可以试图锁定全局解释器锁从而被运行。有些时候，原来的线程会再次获得全局解释器锁再次切回解释器。

这意味着当调用PyEval_SimpleString时，即使你持有全局解释器锁，其他线程仍有机会被执行，这样的副作用无可避免。另外，当你调用以C语言写就的模块(包括许多内置模块)存在着将控制权释放给其他线程的可能性。基于这个原因，当你用两个C线程来执行计算密集的脚本，它们确实能分享CPU时间并发运行，但由于全局解释器锁的存在，在多处理器的计算机上，无法通过线程充分计算机的CPU处理能力。

启用线程支持在多线程的C程序使用之前，必须调用一些初始化例程。如果编译解释器库时启用了多线程支持(通常情况如此)，你就有了一个是否启用线程的运行时选项。除非你计划使用线程，否则不建议启用该选项。未启用该选项，可以避免因互斥锁定其内部数据结构而产生的系统开销。但是如果你打算用来扩展多线程应用，你就需要在初始化解释器的时候启用线程支持。我个人建议，应该在主线程执行时就初始化，最好是在应用程序启动的时候，就调用下面两行代码：

//initialize PythonPy_Initialize();

//initialize thread supportPyEval_InitThreads();

这两个函数都返回void，所以无需检查错误代码。现在，我们可以假定Python解释器已准备好执行Python代码。Py_Initialize分配解释器库使用的全局资源。调用PyEval_InitThreads则启用运行时线程支持。这导致Python启用其内部的互斥锁机制，用于解释器内代码关键部分的系列化访问。此函数的另一个作用是锁定全局解释器锁。该函数完成后，需要由用户负责释放该锁。不过，在释放锁之前,你应该捕获当前PyThreadState对象的指针。后续创建新的Python线程以及结束使用Python时要正确关闭解释器，都需要用到该对象。下面这段代码用来捕获PyThreadState对象指针:

PyThreadState*mainThreadState=NULL;

//save a pointer to the main PyThreadState objectmainThreadState=PyThreadState_Get();

//release the lockPyEval_ReleaseLock();

创建新的执行线程

在Python里，每个执行Python代码的线程都需要一个PyThreadState对象。解释器使用此对象来管理每个线程独立的数据空间。理论上，这意味着一个线程中的动作不会牵涉到另一个线程的状态。例如，你在一个线程中抛出异常，其他Python代码片段仍会继续运行，就好象什么事情都没有发生一样。你必须帮助Python管理每个线程的数据。为此，你需要为每个执行Python代码的C线程手工创建一个PyThreadState对象.要创建PyThreadState对象，你需要用到既有的PyInterpreterState对象。PyInterpreterState对象带有为所有参与的线程所共享的信息。当你初始化Python时，它就会创建一个PyInterpreterState对象，并将它附加在主线程的PyThreadState对象上。你可以使用该解释器对象为你自己的C现成创建新的PyThreadState。请参考下面代码

//get the global lockPyEval_AcquireLock();

//get a reference to the PyInterpreterStatePyInterpreterState*mainInterpreterState=mainThreadState->interp;

//create a thread state object for this threadPyThreadState*myThreadState=PyThreadState_New(mainInterpreterState);

//free the lockPyEval_ReleaseLock();

执行 Python 代码现在我们已创建PyThreadState对象，你的C线程就可以开始使用Python API执行Python脚本。从C线程执行Python代码时，你必须遵守一些简单的规则。首先，您在进行任何会改变当前线程状态的操作前必须持有全局解释器锁。第二，必须在执行任何Python代码之前，必须将该线程特定的PyThreadState对象加载到解释器。一旦您已经满足这些条件，您可以通过诸如PyEval_SimpleString函数来执行任意的Python代码，并记得在执行结束时切出PyThreadState对象并释放全局解释器锁。请参考下面代码，注意代码中“锁定、切换、执行、切换，解锁”的对称关系：

//grab the global interpreter lockPyEval_AcquireLock();

//swap in my thread statePyThreadState_Swap(myThreadState);

//execute some python codePyEval_SimpleString("import sys\n");

PyEval_SimpleString("sys.stdout.write(‘Hello from a C thread!\n‘)\n");

//clear the thread statePyThreadState_Swap(NULL);

//release our hold on the global interpreterPyEval_ReleaseLock();

清除线程

一旦你的C线程不再需要Python解释器，你必须释放相关资源。为此，需要删除该线程的PyThreadState对象，相关代码如下：

//grab the lockPyEval_AcquireLock();

//swap my thread state out of the interpreterPyThreadState_Swap(NULL);

//clear out any cruft from thread state objectPyThreadState_Clear(myThreadState);

//delete my thread state objectPyThreadState_Delete(myThreadState);