在使用sphinx的过程中有出现一些问题,也有注意事项,做一个备忘。

    一.问题及解决方案

Q1:采用setFilter过滤的时候出现

query is non-computable(sing NOT operator)

原因:在过滤等操作的字段在配置文件sphinx.conf中没有定义。


Q2:采用扩展模式进行全文检索时出现

查询结果为空,不报错

原因:在进行全文检索的时候采用扩展模式没有配合设置相应的属性;'@AppID "-5"'这种扩展模式要搭配setMatchMode(SPH_MATCH_EXTENDED)使用


Q3:

针对整数的注意事项

1>正整数采用sql_attr_uint(32位无符号整数)即可

2>负整数采用sql_attr_bigint(64位有符号整数)即可


Q4:

过滤时间在配置文件中通常采用UNIX_TIMESTAMP,在PHP中利用API时怎样处理?

解决:

使用strtotime将时间字符串转化成时间戳


Q5:

ERROR: index 'oss_test_index': sql_range_query: Got timeout reading communication packets

原因:超过了数据库的超时时间


Q6:

searchd error: per-query max_matches=2000 out of bounds (per-server max_matches=1000)

原因:设置的最大limit值不能超过配置文件的maxmatches的值,因此修改值需要

注意的是如果在设置的时候$sphinx->setLimits(start,len,max),不设置最大的max系统还是默认为1000

最妥善的还是$sphinx->setLimits(($pageNo-1)*$pageSize,$pageSize,$pageNo*$pageSize


Q7:

如何排序

解决:

 $this->sphinx->setSortMode(SPH_MATCH_EXTENDED,"Daily desc,AdID");

Q8:

出现断言失败的问题

原因:大多数是因为参数不是要求的类型,因此要转换成该类型,通常需要int强制转换


Q9:

可忽略(在重整广告报表的过程中出现查询数据和导出数据不一致的问题)

原因:参数没有转化为int类型(setLimits())


Q10:

在只更新增量索引的情况下,并没有将新增的数据插入检索到的文件中

原因:增量索引分区的范围和主索引的分区范围不一样,主索引是min(id)~counter表的max_id,增量索引的范围是counter表的max_id到statappadoss表的最大id,所以增量索引在继承主索引时需要重写sql_query_range的值


Q11:

多个索引一起引用的时候,为什么会出现返回的全文检索字段意义不明呢

原因:索引中定义的全文检索字段sql_field_string不同


Q12:

将增量索引的结果合并到主索引中的时候出现:attribute mismatch (me=/var/lib/sphinxsearch/data/oss_test_index, in=/var/lib/sphinxsearch/data/oss_test_index_throttled, idx=11, myattr=uint rate_id:32@640, inattr=bigint is_ex

原因:主索引和增量索引查询得到的结果字段的顺序和属性必须是一致的。


Q13:

searchd error: client version is higher than daemon version .

原因:是因为客户端版本与服务器版本不同。。。这时候才想起来,服务器是很早之前安装的3.24的版本,现在都4.1了,我本地下载的4.1肯定对不上了~~所以只要用服务器端的sphinxapi替换下就可以了~~


Q14:在使用非!检索的时候出现

query is non-computable(single NOT operator)

原因:全文索引不支持单个操作,因此需要在索引文件里面增加一个能够检索所有文件的全文检索列

如下:

select ...’select_all‘ as dummy...=》全文检索列为dummy,值为select_all.这样就可以检索所有的documents

再从所有documents中过滤掉!的值,如下:

$sphinx->Query('(@dummy SELECT_ALL)(@AppID !"-5")','oss_test_index')


Q15:

对于一个字段既有字符串,又有负数,还有正数的情况下怎样解决?

方案一:如问题十四所讲,单独使用全文索引(十四所述方法可以查询负数)

方案二:在索引中增加同一列(添加别名),一列定义bigint类型用作整数(正数和负数)过滤

                另外一列用作全文索引(字符串的查询)。如下:

                a.AppID,a.AppID as AppIDString

                 sql_attr_bigint                 =AppID
                 sql_field_string                = AppIDString

                $sphinx->setFilter('AppID',array(-5),true);

                $result = $sphinx->Query('@AppIDString com.moji.MojiWeather','oss_test_index');

                //如上,联合使用

        二.索引文件需要定时重建来更新数据,主索引文件根据情况可较长时间建一次或者不建,增量索引可以酌情不长的一段时间建一次。在定时见索引的过程中用到Linux系统的定时器crontab来调用shell脚本(shell脚本可以放在sphinxsearch目录下)

主索引脚本:build_main_index.sh

#!/bin/sh 
#停止正在运行的searchd
#/etc/init.d/sphinxsearch stop >> /var/log/sphinxsearch/searchd.log
#建立主索引
indexer oss_test_index --rotate>> /var/lib/sphinxsearch/data/oss_test_index.log
#启动守护程序
#/etc/init.d/sphinxsearch start >> /var/log/sphinxsearch/searchd.log

增量索引脚本:build_delta_index.sh

#!/bin/sh 
#停止sphinx服务,将输出重定向
#/etc/init.d/sphinxsearch stop >> /var/log/sphinxsearch/searchd.log 
#重新建立增量索引,将输出重定向
indexer oss_test_index_throttled --rotate>> /var/lib/sphinxsearch/data/oss_test_index_throttled.log
#将增量合并到主索引中
indexer --merge oss_test_index oss_test_index_throttled --rotate>> /var/lib/sphinxsearch/data/oss_test_index_throttled.log
#启动服务
#/etc/init.d/sphinxsearch start >> /var/log/sphinxsearch/searchd.log
#rotate 参数的使用旨在确保索引的建立能够正常的使用。当索引正在建立的时候不影响查询(old文件可以满足查询),如果索引成功了新生成的new文件>为替换原有的old文件,如果索引失败了将继续使用old文件。

定时器如下:

在root的用户下:crontab -e打开运行文件,添加一下定时器

*/10 * * * * /etc/sphinxsearch/build_delta_index.sh > /dev/null 2>&1
0 8 * * * /etc/sphinxsearch/build_main_index.sh > /dev/null 2>&1