php分词搜索,搜索关键字词语拆分SCWS中文分词

SCWS是一个简易中文分词系统,采用C语言开发,支持PHP扩展。本文介绍了SCWS的安装、PHP扩展安装及词库配置,并提供了一个PHP实例展示如何使用SCWS进行中文分词。

SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)。 这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开,所以如何准确并快速分词一直 是中文分词的攻关难点。

SCWS 采用纯 C 语言开发,不依赖任何外部库函数,可直接使用动态链接库嵌入应用程序,支持的 中文编码包括 GBK、UTF-8 等。此外还提供了 PHP 扩展模块,可在 PHP 中快速而方便地使用分词功能。

一、安装SCWS

1、下载SCWS源码并解压到当前目录

wget -q -O - http://www.xunsearch.com/scws/down/scws-1.2.1.tar.bz2 | tar xjf -

2、进入源码目录配置和编译SCWS

cd scws-1.2.1

./configure --prefix=/usr/local/scws

make install

安装SCWS完成

二、安装SCWS的PHP扩展

1、进入scws-1.2.1的phpext目录,执行phpize

cd phpext

phpize

2、执行phpext目录下的configure配置并安装PHP扩展

./configure --with-scws=/usr/local/scws --with-php-config=/usr/bin/php-config

make install

执行 whereis php-config或 which php-config查找 php-config的位置

如果找不到,尝试 yum install php-devel

3、配置php.ini

vim /etc/php.d/scws.ini

[scws]

extens

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值