集成nlpir语义分析
Java 集成 NLPIR 语义分析系统1 简介NLPIR 是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。NLPIR 分词系统前身为 2000 年发布的 ICTCLAS 词法分析系统,从 2009 年开始,为了和以前工作进行大的区隔,并推广 NLPIR 自然语言处理与信息检索共享平台,调整命名为NLPIR 分词系统。NLPIR 系统支持多种编码( GBK 编码、UTF8 编码、 BIG5 编码) 、多种操作系统(Windows, Linux, FreeBSD 等所有主流操作系统) 、多种开发语言与平台(包括:C/C++/C#,Java,Python,Hadoop 等) 。本文中,我们讨论 NLPIR 与 Java Web 项目的集成使用。2 源码下载 URL 地址可以下载整个的 NLPIR 项目,如果要下载某一单独部分,比如 summary(摘要) ,在下载时需要用 TortoiseSVN 工具,在 check out 里输入地址: tree/master 换成 trunk,下载。3 与 web 项目集成web 项目的搭建与配置在这里不在累述。NLPIR2016 版本可以使用配置文件配置需要读取的 dll 路径使用配置文件时,代码中初始化接口时需要修改读取 dll 文件的路径。如:图中的 nlpirpathString 需要读取 dll_or_so_path 来获得(避免又用配置文件,有放 dl