几个月之前需要做一个在线教学资源的项目功能,由于涉及到中文资源搜索,且自觉功力尚浅只好在线上查找前辈们的中文搜索的一些做法。
比较幸运的是,当时确实没用多久时间就找到LCTCLAS张华平博士的NLPIR中文分词系统PS:此处附下载地址 http://ictclas.nlpir.org/newsdownloads?DocId=389 最初的时候,这个也比较好用,因为是win32项目,直接将解压好的win32下的动态库和依赖库放置在release/debug下,同时将解压后的Data文件夹放置在release/debug文件夹下。接下来在项目中配置好库的路径,之后就是自己调用库函数进行中文分词操作。
/*
m_InStr 需要进行中文分词的字符串
OutStr 分词操作之后的字符串数组
*/
BOOL ReadDIRFile::Cstr2strs(CString& m_InStr,vector<CString>& OutStr)
{
if (!NLPIR_Init())
{
int ErrNum=GetLastError();
return FALSE;
}
CString InStr,m_OutStr;//("陌生的人给我一支兰州"),m_OutStr