1.下载sphinx
没想到sphinx3解压后即可;
wget http://sphinxsearch.com/files/sphinx-3.0.2-2592786-linux-amd64.tar.gz
grep -v "^#" sphinx.conf.dist | grep -v "^\s#" | grep -v "^$" >sphinx.conf
安装依赖包:yum -y install make gcc g++ gcc-c++ libtool autoconf automake imake mysql-devel libxml2-devel expat-devel
不安装有可能报错误呢?
sql_query_pre = SET SESSION query_cache_type = OFF # 还特定于MySQL源代码,在预查询中禁用查询缓存(仅用于索引器连接)非常有用,因为索引查询不会经常重新运行,而且缓存结果也没有意义。这可以通过以下方式实现:
sql_ranged_throttle
远程查询限制期,以毫秒为单位。可选,默认值为0(不节流)。适用于SQL数据源(mysql,pgsql,mssql)只。
索引器在数据库服务器上施加太多负载时,节流可能很有用。它会使索引器在每个范围查询步骤中以指定的毫秒数休眠一次。这种睡眠是无条件的,并且在提取查询之前执行。
在每个查询步骤之前,sql_ranged_throttle = 1000#睡眠1秒
## N-Gram索引的分词技术
## N-Gram是指不按照词典,而是按照字长来分词,这个主要是针对非英文体系的一些语言来做的(中文、韩文、日文)
## 对coreseek来说,这两个配置项可以忽略。
# ngram_len= 1# ngram_chars= U+3000..U+2FA1F
source documents
{
type=mysql
sql_host=localhost
sql_user=root
sql_pass=sql_db=test
sql_port= 3306 # optional, default is 3306sql_query=\
SELECT id, group_id, title, content \
FROM documents
sql_query_pre=SET NAMES utf8
sql_query_pre= SET SESSION query_cache_type=OFF
sql_query_pre= REPLACE INTO sph_counter SELECT 1,MAX(id) FROM documents
sql_ranged_throttle= 0}
source src1throttled : documents
{
sql_ranged_throttle= 100}
index documents
{
source=documents
path= /var/data/documents
docinfo= externdict=keywords
mlock= 0morphology=none
min_word_len= 1ngram_len= 1ngram_chars= U+3000..U+2FA1F
html_strip= 1}
indexer
{
mem_limit=128M
}
searchd
{
listen= 9312listen= 9306:mysql41
log= /var/log/searchd.log
query_log= /var/log/query.log
read_timeout= 5client_timeout= 300max_children= 30persistent_connections_limit= 30pid_file= /var/log/searchd.pid
seamless_rotate= 1preopen_indexes= 1unlink_old= 1mva_updates_pool=1M
max_packet_size=8M
max_filters= 256max_filter_values= 4096max_batch_queries= 32workers= threads # forRT to work
binlog_path= /var/data
}
2.报错信息
执行:./searchd -c /usr/local/sphinx/etc/sphinx.conf
FATAL: failed to open '/usr/local/var/data/binlog.lock': 2 'No such file or directory
解决:配置 即可:找的位置不对: binlog_path = /var/data
2.2
执行:./indexer -c /usr/local/sphinx/etc/sphinx.conf --all
ERROR: index 'documents': sql_query_pre[1]: Query cache is disabled; restart the server with query_cache_type=1 to enable it (DSN=mysql://root:***@localhost:3306/test)
解决:mysql没有开启缓存
如果何配置查询缓存:
query_cache_type 这个系统变量控制着查询缓存工能的开启的关闭。
query_cache_type=0时表示关闭,1时表示打开,2表示只要select 中明确指定SQL_CACHE才缓存。
这个参数的设置有点奇怪,1、如果事先查询缓存是关闭的然而用 set @@global.query_cache_type=1; 会报错
ERROR1651 (HY000): Query cache is disabled; restart the server with query_cache_type=1to enable it2、如果事先是打开着的尝试去闭关它,那么这个关闭也是不完全的,这种情况下查询还是会去尝试查找缓存。
最好的关闭查询缓存的办法就是把my.cnf 中的query_cache_type=0然后再重启mysql。
二.安装php扩展 --sphinx
我的环境是php7.官网上没有,但是在[ Browse Source ] 找到了
wget http://git.php.net/?p=pecl/search_engine/sphinx.git;a=snapshot;h=339e123acb0ce7beb2d9d4f9094d6f8bcf15fb54;sf=tgz
tar -xzf sphinx-339e123.tar.gz -C ./php-sphinx --strip-components 1 #解压后重新命名
#竟然还下不来,只能ftp上传了
解压:tar zxf sphinx-339e123.tar.gz
编译:
./configure --with-php-config=/usr/bin/php-config --with-sphinx=/usr/local/sphinx/libsphinxclient
# 这个地方好大的坑,一直提示:Cannotfindlibsphinxclient headersmake && make install
PHP : /usr/bin/php
PHP_SAPI : cli
PHP_VERSION :7.0.27ZEND_VERSION:3.0.0PHP_OS : Linux- Linux vic 2.6.32-642.13.1.el6.x86_64 #1 SMP Wed Jan 11 20:56:24 UTC 2017x86_64
INI actual :/usr/local/src/sphinx-339e123/tmp-php.ini
More .INIs :
CWD :/usr/local/src/sphinx-339e123
Extra dirs :
VALGRIND : Not used=====================================================================TIME START2018-03-29 11:11:47
=====================================================================No tests were run.
搞了很久终于可以了;
最后一步:修改php.ini
extension = sphinx.so
然后重启php-fpm即可,执行php -m,看到有sphinx扩展说明安装成功
php -m
终于安装成功了;
2.sphinx 用php的使用
$sphinx = newSphinxClient;$sphinx->setServer("localhost", 9312);$sphinx->setMatchMode(SPH_MATCH_ANY); //匹配模式 ANY为关键词自动拆词,ALL为不拆词匹配(完全匹配)
$sphinx->SetArrayResult ( true ); //返回的结果集为数组
$result = $sphinx->query("test","*"); //星号为所有索引源
$count=$result['total']; //查到的结果条数
$time=$result['time']; //耗时
$arr=$result['matches']; //结果集
$id='';for($i=0;$i
}$id=substr($id,0,-1); //结果集的id字符串
三、中文分词
1.安装scws
下载:wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2
./configure --prefix=/usr/local/scwsmake
make install
2.下载词库
进入:cd /usr/local/scws/etc下,
wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2 #gbk
wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 #utf8
wget http://www.xunsearch.com/scws/down/scws-dict-cht-utf8.tar.bz2 #繁体中文
[root@iZije4ffdt70xyZ etc]# ll
total9204
-rw-r--r-- 1 root root 4383 Jun 4 18:11rules_cht.utf8.ini-rw-r--r-- 1 root root 3729 Jun 4 18:11rules.ini-rw-r--r-- 1 root root 4424 Jun 4 18:11rules.utf8.ini-rw-r--r-- 1 root root 4030636 Feb 24 2016 scws-dict-chs-gbk.tar.bz2-rw-r--r-- 1 root root 4090094 Feb 24 2016 scws-dict-chs-utf8.tar.bz2-rw-r--r-- 1 root root 1277616 Feb 24 2016 scws-dict-cht-utf8.tar.bz2
[root@iZije4ffdt70xyZ etc]# tar-jxvf scws-dict-chs-gbk.tar.bz2
dict.xdb
[root@iZije4ffdt70xyZ etc]# tar-jxvf scws-dict-chs-utf8.tar.bz2
dict.utf8.xdb
[root@iZije4ffdt70xyZ etc]# tar-jxvf scws-dict-cht-utf8.tar.bz2
dict_cht.utf8.xdb
[root@iZije4ffdt70xyZ etc]#
3.安装php扩展
cd SCWS_1.x.x/phpext
phpize
./configure --with-php-config=PHP_HOME/bin/php-config
make
make install
4.cd SCWS_1.x.x/phpext
php scws_test.php
检测结果是否正确