编译PHP的SCWS中文分词扩展

SCWS 是 Simple Chinese Words Segmentation 的缩写,即简易中文分词系统。

版本号:1.1.3

 

1. 取得 scws-1.1.2 的代码
wget http://www.ftphp.com/scws/down/scws-1.1.3.tar.bz2

2. 解开压缩包
[hightman@d1 ~]$ tar xvjf scws-1.1.2.tar.bz2

3. 进入目录执行配置脚本和编译
[hightman@d1 ~]$ cd scws-1.1.2
[hightman@d1 ~/scws-1.1.2]$ ./configure --prefix=/usr/local/scws ; make ; make install

这个地方,从configure开始就会出现众多的Warning,提示你什么什么东西没有,没有问题,不会对安装有任何影

响,继续下一步就行了。

注:这里和通用的 GNU 软件安装方式一样,具体选项参数执行 ./configure --help 查看。

常用的三个选项为:

--prefix=<scws的安装目录>

--disable-mmap <这表示禁用 MMAP 来读取 xdb,在 debian, ubuntu 的部分 Linux 中建议关闭 mmap>

--enable-developer <这表示以开发者模式编译,主要是用于调试编译时加入了 -g 选项及部分标准输出的信息>


4. 顺利的话已经编译并安装成功到 /usr/local/scws 中了,执行下面命令看看文件是否存在
[hightman@d1 ~/scws-1.1.2]$ ls -al /usr/local/scws/lib/libscws.la

5. 试试执行 scws-cli 文件
[hightman@d1 ~/scws-1.1.2]$ /usr/local/scws/bin/scws -h
scws (scws-cli/1.1.2)
Simple Chinese Word Segmentation - Command line usage.
Copyright (C)2007 by hightman.
...


6 用 wget 下载并解压词典,或从主页下载然后自行解压再将 *.xdb 放入 /usr/local/scws/etc 目录中

[hightman@d1 ~/scws-1.1.2]$ cd /usr/local/scws/etc
[hightman@d1 /usr/local/scws/etc]$ wget http://www.ftphp.com/scws/down/scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ wget http://www.ftphp.com/scws/down/scws-dict-chs-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-utf8.tar.bz2

7. 写个小程序测试一下

[hightman@d1 ~]$ cat > test.c

#include <scws.h>

#include <stdio.h>

main()

{

scws_t s;

s = scws_new();

scws_free(s);

printf("test ok!/n");

}

这个地方其实用VIM来编写这个test.c也是一样的,关键是测试SCWS安装成功了没有。


8. 编译测试程序

gcc -o test -I/usr/local/scws/include -L/usr/local/scws/lib test.c -lscws -Wl,--rpath -Wl,/usr/local/scws/lib
./test

9. 这样就好顺利安装完毕可以使用 libscws 这套 C-API 了

10. 如果您需要在 php 中调用分词,建议继续阅读本文安装 php 扩展,否则可跳过不看。

假设您已经将 scws 按上述步骤安装到 /usr/local/scws 中。

安装此扩展要求您的 php 和系统环境安装了相应的 autoconf automake 工具及 phpize 。


1) 进入源码目录的 phpext/ 目录 ( cd ~/scws-1.1.2 )
     这个地方的目录其实应该是~/scws-1.1.2/phpext/,如果你是按照上面的步骤来的话,要是不是就定位到刚

开始,scws的源代码包解压的地方就行

我以前就是因为仅仅跳入到~/scws-1.1.2/目录里,执行phpize总是失败!

2) 执行 phpize (在PHP安装目录的bin/目录下)
    还是在刚刚提到的那个目录下执行phpize,不要跳出去

3) 执行 ./configure --with-scws=/usr/local/scws
若 php 安装在特殊目录 $php_prefix, 则请在 configure 后加上 --with-php-config=$php_prefix/bin/php-config

4) 执行 make 然后用 root 身份执行 make install

5) 在 php.ini 中加入以下几行
[scws]

;

; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,

; 再把 extension = scws.so 指定绝对路径。

;
extension = scws.so

scws.default.charset = gbk

scws.default.fpath = /usr/local/scws/etc


6) 命令行下执行 php -m 就能看到 scws 了或者在 phpinfo() 中看看关于 scws 的部分,记得要重启 web 服务器

才能使新的 php.ini 生效。

7) 这样就算安装完成了,余下的工作只是PHP代码编写问题了。

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值