Ubuntu 12.04下安装中文分词搜索Coreseek

        Coreseek 是一款中文全文检索和搜索软件,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业和垂直搜索、论坛站内搜索、数据库搜索、文档文献检索、信息检索、数据挖掘等应用场景。在安装Coreseek之前,确认电脑上已经安装了如下软件包,想确认电脑上面是否安装其中某个包,可以输入命令“dpkg -l gcc”测试是否安装了gcc软件包。主要如下:

apt-get install make gcc g++ automake libtool mysql-client libmysqlclient15-dev libxml2-dev libexpat1-dev

1、安装上述软件包之后,下载“coreseek-4.1-beta.tar.gz”,输入下面命令解压:

tar -zvxf coreseek-4.1-beta.tar.gz

2、解压之后,通过命令“cd coreseek-4.1-beta/mmseg-3.2.14/”进入到mmseg-3.2.14文件夹,依次输入三条命令,如果出现错误需要去解决。

./bootstrap

./configure --prefix=/usr/local/mmseg3

make && make install

3、如果没有出现错误,表明mmseg安装成功了,下面继续安装csft,输入下面的命令(对于configure,可以使用“./configure -h”命令查看参数):

cd ..

cd csft-4.1/

sh buildconf.sh

./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql

make && make install

4、输入以下命令进行测试。
测试1:

cat testpack/var/test/test.xml


测试2:分词

/usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc/ var/test/test.xml


测试3:建立索引

/usr/local/coreseek/bin/indexer -c etc/csft.conf --all


测试4:搜索

/usr/local/coreseek/bin/search -c etc/csft.conf 网络搜索


5、安装Sphinx,生成动态模块
先安装libsphinxclient,输入命令:

cd ~/Downloads/coreseek-4.1-beta/csft-4.1/api/libsphinxclient

./configure

make

sudo make install

安装好之后,再安装sphinx,输入下列命令:

cd ~/Downloads

tar -zvxf sphinx-1.3.0.tgz

cd /sphinx-1.3.0/sphinx-1.3.0

sudo su

/usr/bin/phpize              #主要是生成configure文件

./configure --with-php-config=/etc/alternatives/php-config --with-sphinx

make && make install

进入到/usr/lib/php5/20090626+lfs/ 将看到生成的sphinx.so模块,找到php.ini配置文件,将生成sphinx.so模块添加到配置文件中,输入下列命令(root权限执行):

cd /usr/lib/php5/20090626+lfs/ 
 
chmod 644 sphinx.so

locate php.ini        #如果不知道php.ini文件在那里,可以输入这个命令查找
 
geany /etc/php5/apache2/php.ini

修改的情况如下:


即添加以下内容:

extension=msqli.so
extension=msql.so
extension=memcache.so
extension=pdo_mysql.so
extension=sphinx.so

注意:添加之后重启apache服务器,输入命令:

sudo /etc/init.d/apache2 restart

在浏览器中输入“http://192.168.1.188:6789/test.php”,可以看到加载的sphinx模块都在。


6、测试coreseek(数据为数据库里面)
修改默认配置文件:

cd /usr/local/coreseek/etc
cp sphinx.conf.dist csft.conf
geany csft.conf

配置文件的修改参考lamp兄弟连给出的。
对当前数据库里面的数据建立索引:


输入命令建立索引和搜索:

cd /usr/local/coreseek/bin
./indexer --all

这个时候可以看到:


建立索引完成之后,输入命令搜索:

./search 百度

结果如下:


在PHP调用之前,先建立监听,输入命令如下:

./searchd     #开启seachd服务

结果如下:


至此,整个过程已经搭建完成。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值