官网地址 http://www.xunsearch.com/scws/
SCWS 中文分词方法
thinkphp5.1 config目录下的app.php文件中增加
//中文分词的目录
‘CONF_PATH’ => Env::get(‘root_path’) . ‘application’ . DIRECTORY_SEPARATOR . ‘你的模块’ . DIRECTORY_SEPARATOR . ‘中文分词的目录’.DIRECTORY_SEPARATOR
thinkphp5.0 application的config.php
//中文分词的目录
‘CONF_PATH’ => ROOT_PATH . ‘application’ . DS . ‘你的模块’ . DS . ‘中文分词的目录’.DS
公共方法:
/**
- 中文分词
- @params string $title 需要分词的语句
- @params int
n
u
m
分
词
个
数
,
默
认
不
用
填
写
∗
∗
/
f
u
n
c
t
i
o
n
g
e
t
t
a
g
s
(
num 分词个数,默认不用填写 **/ function get_tags(
num分词个数,默认不用填写∗∗/functiongettags(title,$num=null){
$pscws = new \app\你的模块\中文分词目录\Pscws();
$pscws->set_dict(config(‘app.CONF_PATH’) . ‘dict.utf8.xdb’);
$pscws->set_rule(config(‘app.CONF_PATH’) . ‘rules.utf8.ini’);
$pscws->set_ignore(true);
p s c w s − > s e n d t e x t ( pscws->send_text( pscws−>sendtext(title);
$words = p s c w s − > g e t t o p s ( pscws->get_tops( pscws−>gettops(num);
$pscws->close();
t a g s = a r r a y ( ) ; f o r e a c h ( tags = array(); foreach ( tags=array();foreach(words as $val) {
$tags = $val[‘word’];
}
return implode(’,’, $tags);
}
Tp5.0框架下
config(‘app.CONF_PATH’) 改成 CONF_PATH
调用方法:
dump(get_tags(‘积分第三方鉴定是非得失佛挡杀佛度是的不舒服’));die;
本地测试结果:
string(50) “是非得失,第三方,鉴定,是的,舒服,积分”