说明:纯笔记向代码,给博主自己看的,操作不来不要问。不喜勿喷
PSCWS4是讯搜提供的纯PHP实现中文分词的类库支持utf8。
PSCWS4中文分词的有关介绍:
http://www.xunsearch.com/scws/
使用后发现,中文分词基本没什么大毛病,英文不能分词。
一、下载pscws的相关文件:
PSCWS4源代码(包括pscws4.class.php、xdb_r.class.php、etc中的规则集文件):http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2
XDB 词典文件(utf8简体中文版) :http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
二、放置文件
将pscws4.class.php、xdb_r.class.php放到更目录下的exte