paoding庖丁解牛中文分词介绍
北京一个同事写的东东,最近要做搜索,所以拿来用用。先学会如何使用。有空再分析分析代码,多向高手学习学习。
下载地址:http://code.google.com/p/paoding/downloads/list
SVN地址:http://paoding.googlecode.com/svn/trunk/paoding-analysis/
1、安装导入
将二进制包paoding-analysis-2.0.4.jar放到自己的classpath下
我是使用maven2来管理jar包的,所以上传然后修改pom.xml如下
<dependency>
<groupId>paoding</groupId>
<artifactId>paoding-analysis</artifactId>
<version>2.0.4</version>
</dependency>
2、配置字典路径
将字典文件安装(也就是拷贝)到某个目录下,比如/data/paoding/dic下
把配置文件paoding-analysis.properties放到自己的classpath下
打开paoding-analysis.properties,把paoding.dic.home属性设置为字
典的安装目录,比如paoding.dic.home=/data/paoding/dic,特别的,如
果字典是安装在classpath下的dic目录下,则可以简单这样配置该属性:
paoding.dic.home=classpath:dic
另外配置上这几个
paoding.knife.class.letterKnife=net.paoding.analysis.knife.LetterKnife
paoding.knife.class.numberKnife=net.paoding.analysis.knife.NumberKnife
paoding.knife.class.cjkKnife=net.paoding.analysis.knife.CJKKnife