pscws4 php 5.5,PHP基于pscws4中文分词

查询分词是我们经常使用的技术, 实际效果如下:

搜索: 中国人自己的芯片企业在哪里, 分出: 芯片,中国人,哪里,自己,企业

然后我们就可以通过这几个关键词来搜索文章

这里给一个scws方法的使用实例

pscws4类下载地址:http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2

辞典文件下载路径:http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2

一. PHP原生应用

require './pscws4/pscws4.class.php';

$pscws = new PSCWS4('utf8');

$pscws->set_dict('./pscws4/dict.utf8.xdb');

$pscws->set_rule('./pscws4/etc/rules.utf8.ini');

$pscws->set_ignore(true);

$text = "南昌雅腾欢迎大家";

$pscws->send_text($text);

$words = $pscws->get_tops(3); //最多取几个

$pscws->close();

$tags = array();

foreach ($words as $val) {

$tags[] = $val['word'];

}

echo implode(',', $tags);

大家下载的代码, 使用的过程中需要调整的两个bug

1. 有个异常“Redefining already defined constructor for class PSCWS4”,这是因为__construct要放在同名构造函数之前

2. 显示的中文为乱码

需要将pscws4.class.php的构造函数修改如下

//function __construct() { $this->PSCWS4(); }

function __construct($charset = 'gbk') { $this->PSCWS4($charset); }

二. tp5.0下应用

1. 将pscws4类及字典放到extend目录下

2. 控制器函数里面加载

343f159ab53d2b0ef66c2fa0c7e39837.png

3812202a40281f5fad75f350511552ee.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值