一 环境
centos7 + Linux + php7.2
二 下载源码
wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2
tar xvjf scws-1.2.3.tar.bz2
三 执行配置脚本和编译
cd scws-1.2.3
./configure --prefix=/usr/local/scws
make && make install
检查是否安装成功
ls -al /usr/local/scws/lib/libscws.la
/usr/local/scws/bin/scws -h
四 下载通用字典
cd /usr/local/scws/etc
wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2
wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
tar xvjf scws-dict-chs-gbk.tar.bz2
tar xvjf scws-dict-chs-utf8.tar.bz2
五 编译PHP扩展
cd /root/scws-1.2.3/phpext
phpize
./configure --with-scws=/usr/local/scws --with-php-config=/usr/local/php/bin/php-config
make && make install
修改PHP配置,在 php.ini 中添加以下几行
extension=scws.so
scws.default.charset=gbk
scws.default.fpath=/usr/local/scws/etc
测试
php -m
<?php
$so = scws_new(); //创建对象
$so->set_charset('utf8'); //设定UTF8
$so->set_ignore(true); //过滤符号
$so->send_text(" 天涯海角,又何妨。");
while ($tmp = $so->get_result()){
print_r($tmp);
}
$so->close();
//高频分词
$so = scws_new(); //创建对象
$so->set_charset('utf8'); //设定UTF8
$so->set_ignore(true); //过滤符号
$so->send_text(" 发现你有了新欢,好像又失恋了。");
print_r($so->get_tops(5)); //获取高频词