C++中嵌入python脚本(结巴分词)

原创 2016年06月01日 13:21:05

这篇主要讲如何在C++文件中,调用python脚本。下面我会结合我的分词程序的实例,介绍需要的函数和方法。


前段时间比较忙,六月份了,期末考试就陆续开始了。忙着复习,所以写这篇关于python嵌入C++的文章稍微晚了点,有一些细节记不太清了,如果有什么问题,欢迎大家联系我一起讨论。

前段时间在做 一个MFC界面的中文分词小程序的时候,发现了一些很有趣的事:传统的机械分词在处理一些较为阴险的句子时,结果可能会十分搞笑,如下图(正序后向最大匹配法 机械分词)


即使是改进之后的逆序前向分词,第二句还是不够满意:



所以我决定引入更为智能的分词模块——python的结巴分词(jieba)模块!

jieba的安装:进入cmd命令行   →  >>pip install jieba

...完美~ 

接下来就遇到一个很棘手的问题,就是如何在C++程序中调用python模块,完成我们需要的功能。


首先,我们先来完成用来分词的python脚本的实现

#sql.py

import jieba;

def fenci(s):
	seg_list = jieba.cut(s);
	l= "|".join(seg_list);
	strs = l.encode('gbk');
	return strs;

我们只需要引入jieba模块,然后定义我们的分词函数,其中唯一参数s是传入的字符串;

jieba.cut()用来对s进行分词,并返回一个列表;

strs为一个将分好的词用”|“连接起来的unicode类型变量,注意,这里Unicode变量不能通过类型转换函数str()直接转换成字符串类型,IDE会报错。

不要慌,经过我吐血研究,可以用改变编码类型的方法轻松解决:就是

strs = l.encode('gbk');

然后将得到的字符串返回就OK。


下面就是最关键的内容了

第一步:环境配置

在VS2015中的 解决方案资源管理器中 右键工程名 >>>点击属性


如下图,将包含目录设为python安装所在目录下的include;库目录设为libs文件夹。


如果你的python版本是2.x

在python安装目录中的libs文件夹中,找到python27.lib,复制一份,命名为python27_d.lib。如下图


准备工作就算OK啦


第二步、编写C++程序

在cpp文件中引入头文件

#include<python.h>

编写C++代码:


<span style="white-space:pre">	</span>//初始化python,必须要做
	Py_Initialize();
	
	//初始化python系统文件路径,保证可以访问到 .py文件
	PyRun_SimpleString("import sys");
	PyRun_SimpleString("sys.path.append('./')");
	
	//声明python对象类型的变量
	PyObject *pModule = NULL, *pFunc = NULL, *pArg = NULL, *result = NULL;
	//引入模块,参数写.py文件的名字,不用加.py后缀
	pModule = PyImport_ImportModule("sql");
	//直接获取模块中的函数,第二个参数为函数名
	pFunc = PyObject_GetAttrString(pModule, "fenci");
	//参数类型转换,传递一个字符串。将c/c++类型的字符串转换为python类型,元组中的python类型查看python文档
	pArg = Py_BuildValue("(s)", st); //st为C++字符指针,s为python字符串类型,()括号的作用是将其保存为元组形式。
	//调用直接获得的函数,并以元组形式传递参数
	result = PyEval_CallObject(pFunc, pArg); 
	char *ss = { 0 };
	//将python类型的返回值转换为c/c++类型
	PyArg_Parse(result, "s", &ss); 
	//结束python嵌入,不能缺少
	Py_Finalize();
	return ss;

然后编译运行,就可以啦~下面放上结巴分词的结果图:

当当当当!


这学期还有一个关于HTML+CSS+PHP+Mysql的Web开发,比较简单,就不发blog了。假期里开始学习Machine Learning的算法,到时候在更新啦~



版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

C++调用python

C++调用python windows下c++中调用python方法

C++中嵌入python程序——参数传递

C++中嵌入python程序——参数传递

jieba完整文档

jieba “结巴”中文分词:做最好的 Python 中文分词组件 "Jieba" (Chinese for "to stutter") Chinese text segmentation...

自然语言处理之:c++中文分词(附源码)

githup地址:https://github.com/jbymy c++中文分词, 分词算法, 有向无环图, hmm,隐性马尔科夫模型...

应用统计学与R语言实现学习笔记(七)——拟合优度检验

Chapter 7 Goodness of Fit本篇是第七章,内容是拟合优度检验。
  • ESA_DSQ
  • ESA_DSQ
  • 2017年05月10日 01:43
  • 864

R语言︱非结构化数据处理神器——rlist包

本文作者:任坤,厦门大学王亚南经济研究院金融硕士生,研究兴趣为计算统计和金融量化交易,pipeR,learnR,rlist等项目的作者。 近年来,非关系型数据逐渐获得了更广泛的关...

如何打包Python脚本使用的Python库[C++嵌入Python]

说明: 我目前做的东西是在C++程序中嵌入Python脚本,然后需要在没有安装Python运行环境的pc上运行C++程序(内嵌有Python脚本)。我当前的机器是安装有Python环境的。 实现方法...

C++调用python脚本

  • 2017年03月24日 18:10
  • 3KB
  • 下载

讲述C++中调用Python脚本

讲述C++中调用Python脚本 2010-02-01 13:25 佚名 清华大学出版社 我要评论(0) 字号:T | T C++中调用Python脚本的意义就不讲了,至...

c++调用python脚本

#include #ifdef WIN32 #include "Python.h" #else #include "/usr/local/include/python2.7/Python.h" #e...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:C++中嵌入python脚本(结巴分词)
举报原因:
原因补充:

(最多只允许输入30个字)