1、在官网上下载最新的工具包
官网地址为:http://ictclas.nlpir.org/newsdownloads?DocId=389
下载解压后结构如下:
树状结构如下:
| Readme.txt-------------------------->介绍
|
+---bin
| +---DocExtractor----------->文档篇章语义抽取系统
| | DocExtractor.bat-->批处理,可以针对指定的文件夹进行语义抽取
| | DocExtractor.dll-->支撑的动态链接库,基于分词基础上
| | DocExtractorSample.exe-->应用程序
| |
| \---ICTCLAS2014----------->分词系统
| ICTCLAS-tools.exe-->分词的支撑工具,可用于测试,本处主要用来做用户词典导入
| importuserdict.bat-->可将用户词典自动导入到系统内
| NLPIR.dll-->Win32下的支撑动态链接库,其他环境的库,可以访问lib对应环境的库文件
| NLPIR.lib
| NLPIR_WinDemo.exe-->Win32下的演示程序,在Win8 32位下编译而成,部分环境可能不支持,或者显示异常
| userdic.txt-->用户词典,用户可以自行编辑
|
+---Data-->系统核心词库
| | BIG2GBK.map
| | BIG5.pdat
| | BIG5.wordlist
| | BiWord.big
| | charset.type
| | Configure.xml
| | CoreDict.pdat
| | CoreDict.pos
| | CoreDict.unig
| | DocExtractor.user
| | FieldDict.pdat
| | FieldDict.pos
| | GBK.pdat
| | GBK.wordlist
| | GBK2BIG.map
| | GBK2GBKC.map
| | GBK2UTF.map
| | GBKA.pdat
| | GBKA.wordlist
| | GBKA2UTF.map
| | GBKC.pdat
| | GBKC.wordlist
| | GBKC2GBK.map
| | GranDict.pdat
| | GranDict.pos
| | ICTPOS.map
| | location.map
| | location.pdat
| | location.wordlist
| | NewWord.lst
| | NLPIR.ctx
| | NLPIR.user
| | NLPIR_First.map
| | nr.ctx
| | nr.fsa
| | nr.role
| | PKU.map
| | PKU_First.map
| | sentiment.pdat
| | sentiment.ung
| | UserDict.pdat
| | UTF2GBK.map
| | UTF2GBKA.map
| | UTF8.pdat
| | UTF8.wordlist
| |
| \---English-->英文处理的支持知识库,如果不需要英文处理的功能,可以不加载本库。
| English.pdat
| English.pos
| English.ung
| English.wordlist
| Irrel2regular.map
| ne.pdat
| ne.pos
| ne.wordlist
|
+---doc-->相关文档支持
| ICTPOS3.0.doc-->我们的词性标注集说明
| NLPIR-ICTCLAS2014分词系统开发手册.pdf-->开发使用手册
|