官网:
http://www.coreseek.cn/news/14/54/
http://www.coreseek.cn/products-install/
使用说明:http://www.coreseek.cn/opensource/mmseg/
一共有4个文件:
basedict.txt
mmseg.ini
mmseg
test.txt
basedict.txt里边是:
数据 1
x:1
程序 1
x:1
test.txt里边是:
程序不知道怎么进行设计
然后mmseg是二进制文件
使用步骤:
1、生成词典词库
./mmseg -u basedict.txt
此时生成basedict.txt.uni,修改名字为uni.lib
2、用生成的词典词库进行自然语言的解析
./mmseg -d ./ test.txt
结果:程序/x 不/x 知/x 道/x 怎/x 么/x 进/x 行/x 设/x 计/x
有人说了,这个不是想要的,我们期待的结果是:
程序 不知道 怎么 进行 设计
此时就需要增加词典识别的内容,毕竟不同领域的数据不一样,还是需要自己添加才更方便&#x