thinkphp5.1和5.0下的中文分词

官网地址 http://www.xunsearch.com/scws/
SCWS 中文分词方法
thinkphp5.1 config目录下的app.php文件中增加
//中文分词的目录
‘CONF_PATH’ => Env::get(‘root_path’) . ‘application’ . DIRECTORY_SEPARATOR . ‘你的模块’ . DIRECTORY_SEPARATOR . ‘中文分词的目录’.DIRECTORY_SEPARATOR
thinkphp5.0 application的config.php
//中文分词的目录
‘CONF_PATH’ => ROOT_PATH . ‘application’ . DS . ‘你的模块’ . DS . ‘中文分词的目录’.DS

公共方法:
/**

  • 中文分词
  • @params string $title 需要分词的语句
  • @params int n u m 分 词 个 数 , 默 认 不 用 填 写 ∗ ∗ / f u n c t i o n g e t t a g s ( num 分词个数,默认不用填写 **/ function get_tags( num/functiongettags(title,$num=null){
    $pscws = new \app\你的模块\中文分词目录\Pscws();
    $pscws->set_dict(config(‘app.CONF_PATH’) . ‘dict.utf8.xdb’);
    $pscws->set_rule(config(‘app.CONF_PATH’) . ‘rules.utf8.ini’);
    $pscws->set_ignore(true);
    p s c w s − > s e n d t e x t ( pscws->send_text( pscws>sendtext(title);
    $words = p s c w s − > g e t t o p s ( pscws->get_tops( pscws>gettops(num);
    $pscws->close();
    t a g s = a r r a y ( ) ; f o r e a c h ( tags = array(); foreach ( tags=array();foreach(words as $val) {
    $tags = $val[‘word’];
    }
    return implode(’,’, $tags);
    }
    Tp5.0框架下
    config(‘app.CONF_PATH’) 改成 CONF_PATH
    调用方法:
    dump(get_tags(‘积分第三方鉴定是非得失佛挡杀佛度是的不舒服’));die;
    本地测试结果:
    string(50) “是非得失,第三方,鉴定,是的,舒服,积分”

文件下载到附件 http://bbs.dolphinphp.com/article/39228

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值