整理NLPIR基本功能函数

最新推荐文章于 2024-07-25 09:20:43 发布

Northeast_Husky

最新推荐文章于 2024-07-25 09:20:43 发布

阅读量933

点赞数 1

分类专栏： NLPIR入门 NLPIR 文章标签： NLPIR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Northeast_Husky/article/details/78212381

版权

NLPIR入门同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

本文介绍了NLPIR分词系统的常用函数，包括NLPIR_ParagraphProcess、NLPIR_ParagraphProcessA、NLPIR_FileProcess等，详细解释了它们的功能和使用方法，帮助初学者理解NLPIR的基本操作。

摘要由CSDN通过智能技术生成

重新开始

直接按网上的教程搞代码，结果把自己呛死……经常一两天都摆不平一个bug！痛定思痛！觉得还是应该先从熟悉张教授的系统做起。

百度文库的：NLPIR-ICTCLAS分词系统开发手册2016版。看了终于觉得有点眉目了，不再是一头雾水。

可以直接从第5部分（接口）看起。

https://wenku.baidu.com/view/85eb9d8b31b765ce040814e9.html

以下整理一些个人认为小白难理解的函数。

NLPIR_ParagraphProcess：

测试最基本的功能，输入一个字符串，输出分词结果字符串，如果不需要标注，调用的时候可以为：NLPIR_ParagraphProcess(sSentence,0)

NLPIR_ParagraphProcessA

const result_t *pResult=NLPIR_ParagraphProcessA(sSentence,&nCount);

//分词的高级功能

//该函数功能为：输入字符串，输出分词结果的result_t结构体数组，nCout为数组大小

//返回的数组结果由系统自行维护，用户直接调用即可

NLPIR_FileProcess

NLPIR_FileProcess("test2.txt","test2_result.txt",1);//对文件进行分词

Double NLPIR_FileProcess(const char*sSourceFilename,const char *sResultFilename,int bPOStagged=1);

NLPIR_GetParagraphProcessAWordCount(s);//得到结果的词数

参数：The source paragraph（一段话）

NLPIR_ ParagraphProcessAW

参数：词数+保存结果的结构体指针

NLPIR_AddUserWord

NLPIR_SaveTheUsrDic

NLPIR_DelUsrWord（这三个看名字也能知道是什么意思）

NLPIR_FingerPrint

提取段落的一个指纹。

参数：const char *sLine：输入的段落

返回值：如果执行成功，返回指纹值，否则返回0。

NLPIR_SetPOSmap

描述：设置使用的POS map（标注集）。

参数：int nPOSmap

ICT_POS_MAP_FIRST 1//计算所一级标注集

ICT_POS_MAP_SECOND 0//计算所二级标注集

ICT_POS_MAP_SECOND 2//北大二级标注集

PKU_POS_MAP_FIRST 3//北大一级标注集

返回值：如果执行成功，返回1，否则返回0。

Northeast_Husky

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。