sphinx与中文分词coreseek(window)

1.Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎。意图为其他应用提供高速、低空间占用、高结果 相关度的全文搜索功能,做数据库的优化。Sphinx可以非常容易的与SQL数据库和脚本语言集成。

2.中文分词coreseek,官网地址:http://www.coreseek.cn/(官网不可以,只可以到别的地方下载),现在用的最多的sphinx中文全文检索,它提供了为Sphinx设计的中文分词包LibMMSeg。这个项目用的词库格式与普通词库的格式不一样, 还需要转换一下格式才能转换成词库文件. 这个项目里提供了一个叫mmseg的可执行文件做词库生成,  做繁体的定制是要收费的。

windows下使用coreseek

(1)首先我们要下载coreseek的压缩包,其中coreseek中api存放一些自带的API类文件、bin目录存放一些命令、etc存放配置文件、var存放创建索引之后的文件

(2)然后解压进入coreseek/etc目录中,打开corf_msyql.conf,编辑索引文件

(3)创建索引打开cmd,进入解压之后的coreseek目录,输入命令.\bin\indexer.exe -c .\etc\csft_mysql.conf --all,没有报错创建索引成功

(4)开启sphinx搜索服务,输入命令.\bin\searchd.exe -c .\etc\csft_mysql.conf,如下显示开启成功

(5)接下来开始让php操作coreseek,打开coreseek文件目录的api目录找到 sphinxapi.php文件复制到你的域名文件下,让你可以访问到,创建php文件与sphinxapi.php文件在同一级目录下,这样可以直接引入,用框架可以放到类文件下,php文件中输入一下代码

<?php
header("content-type:text/html;charset=utf8");
include'./sphinxapi.php'; //包含sphinxapi
$sphinx=new SphinxClient(); //实例化
$sphinx->SetServer('120.25.168.165',9312);//链接
$res=$sphinx->Query("北京","*");//查询的字段第二参数是你配置文件里面写得规则这里是*就会匹配所有规则
print_r($res);//打印数据
?>

如图所示将以上代码放到该目录下操作一下如果在浏览器输出一些数据你的coreseek就安装好啦!php也可以使用了;


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值