PHP SCWS 中文分词扩展的安装及测试

一 环境
centos7 + Linux + php7.2

二 下载源码

wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2
tar xvjf scws-1.2.3.tar.bz2

三 执行配置脚本和编译

cd scws-1.2.3
./configure --prefix=/usr/local/scws
make && make install

检查是否安装成功

ls -al /usr/local/scws/lib/libscws.la
/usr/local/scws/bin/scws -h

四 下载通用字典

 cd /usr/local/scws/etc
wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2
wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
tar xvjf scws-dict-chs-gbk.tar.bz2
tar xvjf scws-dict-chs-utf8.tar.bz2

五 编译PHP扩展

cd /root/scws-1.2.3/phpext
phpize
./configure --with-scws=/usr/local/scws --with-php-config=/usr/local/php/bin/php-config
make && make install

修改PHP配置,在 php.ini 中添加以下几行

extension=scws.so
scws.default.charset=gbk
scws.default.fpath=/usr/local/scws/etc

测试
php -m

<?php
$so = scws_new();              //创建对象
$so->set_charset('utf8');          //设定UTF8
$so->set_ignore(true);             //过滤符号
$so->send_text("  天涯海角,又何妨。");
while ($tmp = $so->get_result()){
    print_r($tmp);
}
$so->close();

//高频分词
$so = scws_new();              //创建对象
$so->set_charset('utf8');          //设定UTF8
$so->set_ignore(true);             //过滤符号
$so->send_text("  发现你有了新欢,好像又失恋了。");
print_r($so->get_tops(5));   //获取高频词
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值