sphinx 源码阅读之 分词,压缩索引,倒排

前言

sphinx 在创建索引前需要做下面几件事:有数据源(pSource),有分词器(pTokenizer),有停止词Stopword 和 字典(pDict),索引引擎。

我们假设 数据源是 mysql, 分词器是 utf8 分词器。

索引前背景介绍

第一步是准备数据源。
这里采用 mysql 数据源。
mysql 数据的特点是一行一个记录。
每个记录有相同的字段。
每个字段可能代表数字,字符串,时间,二进制等信息,我们都可以按字符串处理即可。

 
 
  1. //数据源
  2. CSphSource_MySQL * pSrcMySQL = new CSphSource_MySQL ();
  3. CSphSource * pSource = pSrcMySQL;

第二步准备分词器和字典。
这里不多说分词器,以后会专门写一篇记录来讲解分词器。
分词器依靠字典,可以把一个字符串分割为一些词语(word)。
然后根据这些词语,我们可以把mysql的每条记录每个字段都分割为若干词语,这里成为分词。
分割后这个分词需要保留几个信息:什么分词,属于哪个记录,属于哪个字段,在字段中的位置。
分词我们会hash (crc32) 成一个数字,冲突了就当做一个词了。
记录标示就是用自增整数ID.
字段一般不会很多,我们假设最多255个,使用8位可以表示。 字段的位置不确定,但是一个字段的内容也不会很多,我们用24位表示足够了。
所以哪个字段和字段的哪个位置就可以用一个32位整数代替了。
这样一个分词就可以用三个整数<wordId, docId, pos>来表示了。

 
 
  1. //分词器
  2. pTokenizer = sphCreateUTF8Tokenizer ();
  3. pSource->SetTokenizer ( pTokenizer );
  4.  
  5. //字典
  6. CSphDict_CRC32 * pDict = new CSphDict_CRC32 ( iMorph );
  7. pSource->SetDict ( pDict );

一个分词称为一个hit, 数据结构如下

 
 
  1. struct CSphWordHit {
  2. DWORD m_iDocID; //文档ID, 唯一代表一个记录
  3. DWORD m_iWordID; //单词ID, 对单词的hash值,可以理解为唯一标示
  4. DWORD m_iWordPos; //储存两个信息:字段位置(高8位)和分词的位置(低24位)
  5. };

我们一条记录一条记录的把所有的记录都分词了,就得到一个分词列表了。
由于这个列表很大,我们需要分成多块储存,这里假设最多16块吧。
对于每块,储存前先排序一下,这样我们就得到 16 个 有序的数组了。
然后我们就可以创建索引了。

 
 
  1. //索引
  2. CSphIndex * pIndex = sphCreateIndexPhrase ( sIndexPath );
  3.  
  4. //开始创建索引
  5. pIndex->Build ( pDict, pSource, iMemLimit )

其中 一切准备完毕后进入 Build 函数。

build 函数创建搜索

进入 build 函数后先准备内容。

在执行 build 函数时 ,先逐条读取记录,然后对每条记录的每个字段会进行分词(Next函数),存在 hit 数据结构中。
而且会把 hit 数据按指定块大小排序后压缩储存在 *.spr 文件中。

块信息储存在 bins 数组中,块数最多16块, 块数用 iRawBlocks 表示。

接下来就是关键的创建压缩索引了。
首先创建索引对象。

 
 
  1. cidxCreate()
  2.  
  3. //打开索引文件,先写入 m_tHeader 信息 和 cidxPagesDir 信息。
  4. fdIndex = new CSphWriter_VLN ( ".spi" );
  5. fdIndex->PutRawBytes ( &m_tHeader, sizeof(m_tHeader) );
  6. //cidxPagesDir 数组全是 -1
  7. fdIndex->PutBytes ( cidxPagesDir, sizeof(cidxPagesDir) );
  8.  
  9. //打开压缩数据文件,先写入一个开始符 bDummy
  10. fdData = new CSphWriter_VLN ( ".spd" );
  11. BYTE bDummy = 1;
  12. fdData->PutBytes ( &bDummy, 1 );

外部排序

现在我们的背景是有16个已经排序的数据存在磁盘上。
由于数据量很大,我们不能一次性全部读进来。

我们的目标是依次挑出最小的hit,然后交给索引引擎处理。

sphinx 使用了 CSphHitQueue 这个数据结构。

CSphHitQueue 你猜是什么? 队列? 恭喜你,猜错了。
CSphHitQueue 是一个最小堆。
且 堆的最大个数是 iRawBlocks。

由于 iRawBlocks 个 hits 数组已经排序,所以我们只需要得到 已排序的hits数组的第一个元素,就可以用堆得到最小的那个元素了
然后我们把最小的这个元素建索引压缩储存,删除最小元素,并取出最小元素所在 hits数组中下一个元素,扔到堆中。
这样就可以从小到大取出所有的元素,并逐个建立索引压缩储存了

这段话看不懂的话,可以看下面的图。

2983121808

创建索引压缩储存

其中创建索引压缩储存主要依靠这个函数

 
 
  1. cidxHit ( tQueue.m_pData );

其中 tQueue.m_pData 的数据结构如下

 
 
  1. /// fat hit, which is actually stored in VLN index
  2. struct CSphFatHit{
  3. DWORD m_iDocID; ///< document ID
  4. DWORD m_iGroupID; ///< documents group ID
  5. DWORD m_iTimestamp; ///< document timestamp
  6. DWORD m_iWordID; ///< word ID in current dictionary
  7. DWORD m_iWordPos; ///< word position in current document
  8. };

hit 是先按 m_iWordID 排序, 相等了再按 m_iDocID 排序, 最后才按 m_iWordPos 排序的

现在我们先不考虑上面的堆,我们假设所有的 hit 已经在一个数组中了,且按上面的规则排序了。
现在我们想做的是对这个 hit 数组创建索引,并压缩储存。

我们现在来看看这个久等的代码吧。

 
 
  1. void CSphIndex_VLN::cidxHit ( CSphFatHit * hit ){
  2. // next word
  3. if ( m_tLastHit.m_iWordID!=hit->m_iWordID ){
  4. // close prev hitlist, if any
  5. if ( m_tLastHit.m_iWordPos ){
  6. fdData->ZipInt ( 0 );
  7. m_tLastHit.m_iWordPos = 0;
  8. }
  9.  
  10. // flush prev doclist, if any
  11. if ( m_dDoclist.GetLength() ){
  12. // finish writing wordlist entry
  13.  
  14. fdIndex->ZipOffset ( fdData->m_iPos - m_iLastDoclistPos );
  15. fdIndex->ZipInt ( m_iLastWordDocs );
  16. fdIndex->ZipInt ( m_iLastWordHits );
  17.  
  18. m_iLastDoclistPos = fdData->m_iPos;
  19. m_iLastWordDocs = 0;
  20. m_iLastWordHits = 0;
  21.  
  22. // write doclist
  23. fdData->ZipOffsets ( &m_dDoclist );
  24. fdData->ZipInt ( 0 );
  25. m_dDoclist.Reset ();
  26.  
  27. // restart doclist deltas
  28. m_tLastHit.m_iDocID = 0;
  29. m_iLastHitlistPos = 0;
  30. }
  31.  
  32. if ( !hit->m_iWordPos ){
  33. fdIndex->ZipInt ( 0 );
  34. return;
  35. }
  36.  
  37. DWORD iPageID = hit->m_iWordID >> SPH_CLOG_BITS_PAGE;
  38. if ( m_iLastPageID!=iPageID ){
  39. // close wordlist
  40. fdIndex->ZipInt ( 0 );
  41.  
  42. m_tLastHit.m_iWordID = 0;
  43. m_iLastDoclistPos = 0;
  44.  
  45. // next map page
  46. m_iLastPageID = iPageID;
  47. cidxPagesDir [ iPageID ] = fdIndex->m_iPos;
  48. }
  49.  
  50. fdIndex->ZipInt ( hit->m_iWordID - m_tLastHit.m_iWordID );
  51. m_tLastHit.m_iWordID = hit->m_iWordID;
  52. }
  53.  
  54. // next doc
  55. if ( m_tLastHit.m_iDocID!=hit->m_iDocID ){
  56. if ( m_tLastHit.m_iWordPos ){
  57. fdData->ZipInt ( 0 );
  58. m_tLastHit.m_iWordPos = 0;
  59. }
  60.  
  61. m_dDoclist.Add ( hit->m_iDocID - m_tLastHit.m_iDocID );
  62. m_dDoclist.Add ( hit->m_iGroupID ); // R&D: maybe some delta-coding would help here too
  63. m_dDoclist.Add ( hit->m_iTimestamp );
  64. m_dDoclist.Add ( fdData->m_iPos - m_iLastHitlistPos );
  65.  
  66. m_tLastHit.m_iDocID = hit->m_iDocID;
  67. m_iLastHitlistPos = fdData->m_iPos;
  68.  
  69. // update per-word stats
  70. m_iLastWordDocs++;
  71. }
  72.  
  73. // the hit
  74. // add hit delta
  75. fdData->ZipInt ( hit->m_iWordPos - m_tLastHit.m_iWordPos );
  76. m_tLastHit.m_iWordPos = hit->m_iWordPos;
  77. m_iLastWordHits++;
  78. }

上面的代码主要做了这个几件事。

第一,根据 m_iWordID 将分词分为 2014 块
并使用 cidxPagesDir 记录块的偏移量(还记得索引文件第二个写入的数据吗)。

第二,对于每一块,我们按分词分组,并在索引文件 spi 中储存每个词组的信息。
具体储存的信息如下

  • 和上一个分词(wordID)的偏差
  • 这个分词组在 spd 文件内的长度
  • 这个分词记录的变化次数
  • 这个分词的 hit 数量

第三,对于每个hit,我们存两部分信息。

  • 位置(pos)偏移量信息
  • 文档(docId)偏移量的信息

上面的三部分信息都储存后,我们就可以快速的解析出来。

模拟索引数据与还原数据

比如对于下面的数据

wordId docId pos
1 1 2
1 1 3
1 2 3
1 3 4
2 1 1

在 spd 文件中,我们可以得到下面的序列

 
 
  1. 2 1 0 3 0 4 0 1 1 1 0 1 1 1 3 1 1 1 2 0 1

其中2 1 0 3 0 4 0我们很容易看出来。
当 wordId 和 docId 不变时,每条 hit 会储存一个 pos 的偏差。
当 wordId 不变, docId 改变时,我们会先储存一个0, 然后偏差重新开始计算。
当 wordId 改变时, 把存在 m_dDoclist 中的关于 docId 变化的信息储存起来。
一个变化储存四条元信息:docId 变化偏差, m_iGroupID,m_iTimestamp, spi 文件内的偏差。

在 spi 文件中,我们可以得到下面的序列

 
 
  1. 1 7 3 4 1

这里的代码实际上也分为两部分。
第一部分是 wordId 的偏差。 然后三个元信息是这个 wordId 的信息, 上面已经提过了,这里就不说了<wordId偏移, 偏移数, 记录变化数, hit数>。

依次扫面这个2 1 0 3 0 4 0, 我们可以恢复 pos 字段2 3 3 4.
而且2 3的 wordId 和 docID 相同。

wordId docId pos
    2
    3
    3
    4
     

根据 索引信息1 7 3 4得到这样的信息: wordId 偏移1,长度偏移数7 ,记录变化数3, hit数4.

于是先决定前四个 wordId。

wordId docId pos
1   2
1   3
1   3
1   4
     

长度偏移数7 信息可以知道接下来的数据就是数据的第二部分了。
又由于之前遇到 3 个0, 所以有三组数据:<1 1 1 0>, <1 1 1 3>, <1 1 1 2>

根据 <1 1 1 0> 我们可以知道前两个 docId 了。

wordId docId pos
1 1 2
1 1 3
1   3
1   4
     

然后根据 <1 1 1 3> 可以知道第三个 docId。 偏移为1, 加上上个 docId 的值,就是 docId = 2 了。

wordId docId pos
1 1 2
1 1 3
1 2 3
1   4
     

最后就是 <1 1 1 2> 决定第四个 docId 是 3 了。

wordId docId pos
1 1 2
1 1 3
1 2 3
1 3 4
     

看到这里,大家发现最后一个信息没有储存或者储存不完整,也不能解析出来。
所以在最后 sphinx 会调用 一个 下面的代码

 
 
  1. //加入结束符
  2. CSphFatHit tFlush;
  3. tFlush.m_iDocID = 0;
  4. tFlush.m_iGroupID = 0;
  5. tFlush.m_iWordID = 0;
  6. tFlush.m_iWordPos =0;
  7. cidxHit ( &tFlush );
  8.  
  9. //填充 m_tHeader 和 cidxPagesDir 信息。
  10. cidxDone ();

然后我们实际的输出时这个样子:

 
 
  1. data: 2 1 0 3 0 4 0 1 1 1 0 1 1 1 3 1 1 1 2 0 1 0 1 1 1 20 0
  2. index: 1 7 3 4 1 15 1 1 0

接着上面的输出就是 索引是0 1 0 1 1 1 20, 数据时1 15 1 1.

0 是 分词的间隔,所以从第二个开始。
<1 0>决定 了 pos 值为 1.
<1 15 1 1> 决定了 wordId 值为 1 + 1 = 2. <1 1 1 20> 决定了 docId 值为 1.

wordId docId pos
1 1 2
1 1 3
1 2 3
1 3 4
2 1 1

最后还有一个0.

决定了解析索引结束。

wordId docId pos
1 1 2
1 1 3
1 2 3
1 3 4
2 1 1
0 0 0

测试代码可以参考这里.

#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<string>
#include<queue>
#include<map>
#include<cmath>
#include<stack>
#include<algorithm>
#include<functional>
#include<unistd.h>
#include <time.h>
#include<stdarg.h>
using namespace std;

#ifdef __int64
typedef __int64 LL;
typedef  unsigned __int64  ULL;
#define LLDF		"%I64d"
#define LLUF		"%I64u"
#else
typedef long long LL;
typedef unsigned long long ULL;
#define LLDF		"%lld"
#define LLUF		"%llu"
#endif
//printf ("hello "LLUF, 1LLU);

typedef unsigned int DWORD;

/// fat hit, which is actually stored in VLN index
struct CSphFatHit {
    CSphFatHit() {
        m_iDocID=m_iWordID=m_iWordPos=0;
        m_iGroupID=m_iTimestamp=1;
    }
    DWORD	m_iDocID;		///< document ID
    DWORD	m_iGroupID;		///< documents group ID
    DWORD	m_iTimestamp;	///< document timestamp
    DWORD	m_iWordID;		///< word ID in current dictionary
    DWORD	m_iWordPos;		///< word position in current document
    void init(DWORD word, DWORD doc, DWORD pos) {
        m_iWordID = word;
        m_iDocID = doc;
        m_iWordPos = pos;
    }
} m_tLastHit;



struct CSphWriter_VLN {
    int	m_iPos;
    vector<DWORD> array;
    CSphWriter_VLN():m_iPos(0) {
    }
    void ZipInt ( DWORD val ) {
        m_iPos++;
        array.push_back(val);
    }
    void ZipOffsets (vector<DWORD>& m_dDoclist) {
        for(int i=0; i<m_dDoclist.size(); i++) {
            ZipInt(m_dDoclist[i]);
        }
    }
    void print() {
        for(int i=0; i<m_iPos; i++) {
            printf(" %d",array[i]);
        }
        printf("\n");
    }
} fdData,fdIndex;


vector<DWORD> m_dDoclist;
DWORD m_iLastDoclistPos = 0;
DWORD m_iLastWordHits = 0;
DWORD m_iLastPageID = 0;
DWORD m_iLastHitlistPos = 0;
DWORD m_iLastWordDocs = 0;
DWORD SPH_CLOG_BITS_PAGE = 10;

void  cidxHit ( CSphFatHit * hit ) {
    // next word
    if ( m_tLastHit.m_iWordID!=hit->m_iWordID ) {
        // close prev hitlist, if any
        if ( m_tLastHit.m_iWordPos ) {
            fdData.ZipInt ( 0 );
            m_tLastHit.m_iWordPos = 0;
        }

        // flush prev doclist, if any
        if ( m_dDoclist.size()) {
            // finish writing wordlist entry
            printf(" %d %d\n",fdData.m_iPos,m_iLastDoclistPos);
            fdIndex.ZipInt ( fdData.m_iPos - m_iLastDoclistPos );
            fdIndex.ZipInt ( m_iLastWordDocs );
            fdIndex.ZipInt ( m_iLastWordHits );

            m_iLastDoclistPos = fdData.m_iPos;
            m_iLastWordDocs = 0;
            m_iLastWordHits = 0;

            // write doclist
            fdData.ZipOffsets ( m_dDoclist );
            fdData.ZipInt ( 0 );
            m_dDoclist.clear();

            // restart doclist deltas
            m_tLastHit.m_iDocID = 0;
            m_iLastHitlistPos = 0;
        }

        if ( !hit->m_iWordPos ) {
            fdIndex.ZipInt ( 0 );
            return;
        }

        fdIndex.ZipInt ( hit->m_iWordID - m_tLastHit.m_iWordID );
        m_tLastHit.m_iWordID = hit->m_iWordID;
    }

    // next doc
    if ( m_tLastHit.m_iDocID!=hit->m_iDocID ) {
        if ( m_tLastHit.m_iWordPos ) {
            fdData.ZipInt ( 0 );
            m_tLastHit.m_iWordPos = 0;
        }

        m_dDoclist.push_back ( hit->m_iDocID - m_tLastHit.m_iDocID );
        m_dDoclist.push_back ( hit->m_iGroupID ); // R&D: maybe some delta-coding would help here too
        m_dDoclist.push_back ( hit->m_iTimestamp );
        m_dDoclist.push_back ( fdData.m_iPos - m_iLastHitlistPos );

        m_tLastHit.m_iDocID = hit->m_iDocID;
        m_iLastHitlistPos = fdData.m_iPos;

        // update per-word stats
        m_iLastWordDocs++;
    }

    // the hit
    // add hit delta
    fdData.ZipInt ( hit->m_iWordPos - m_tLastHit.m_iWordPos );
    m_tLastHit.m_iWordPos = hit->m_iWordPos;
    m_iLastWordHits++;
}

int main() {
    CSphFatHit hits[10];
    hits[0].init(1,1,2);
    hits[1].init(1,1,3);
    hits[2].init(1,2,3);
    hits[3].init(1,3,4);
    hits[4].init(2,1,1);
    hits[5].init(0,0,0);
    for(int i=0; i<6; i++) {
        cidxHit(hits+i);
    }
    printf("data: ");
    fdData.print();
    printf("index: ");
    fdIndex.print();


    return 0;
}


推理 - 搜索信息

假设我们又上面的压缩的信息了。
我们要搜索一个词时,会如何工作呢?
假设我们已经得到这个词的 wordId 了,只需要二分一下,就可以再 O(log(1024)) 的时间内得到 wordId 在那个块内

找到一个块内,出现一个问题,我们不能再次二分查找来找到对应的分词列表。 因为这个 index 储存的是和上一个分词的相对偏移量,那只好全部读入内存,扫描一遍对偏移量求和,然后才能找到对应的词。

这个过程中我们进行了两次 IO 操作。
第一次读取块列表信息 cidxPagesDir。
第二次读取选中的那一块的所有数据。

虽然储存偏移量节省了一些磁盘储存,但是却是用扫描整块数据为代价的。我们本来可以直接二分整块数据的。

不管怎样,我们在索引中找到了需要查找的那个分词的位置。
然后我们可以在数据文件内读取对应的信息,然后得到对应记录的id了。

当然,上面这个只是我的推理,下面我们来看看 sphinx 是怎么搜索的吧。

sphinx 搜索方法

看 sphinx 的搜索方法,只需要看 CSphIndex_VLN 的 QueryEx 函数即可。
首先对查询的语句进行分词,然后读取索引头 m_tHeader, 读取分块信息 cidxPagesDir。
然后就对分词进行搜索了。
为了防止相同的分词重复查找,这里采用二层循环,先来判断这个分词之前是否搜索过,搜索过就记下搜索过的那个词的位置。
没搜索过,就搜索。

核心代// lookup this wordlist page

 
 
  1. // offset might be -1 if page is totally empty
  2. SphOffset_t iWordlistOffset = cidxPagesDir [ qwords[i].m_iWordID >> SPH_CLOG_BITS_PAGE ];
  3. if ( iWordlistOffset>0 ){
  4. // set doclist files
  5. qwords[i].m_rdDoclist.SetFile ( tDoclist.m_iFD );
  6. qwords[i].m_rdHitlist.SetFile ( tDoclist.m_iFD );
  7.  
  8. // read wordlist
  9. rdIndex.SeekTo ( iWordlistOffset );
  10.  
  11. // restart delta decoding
  12. wordID = 0;
  13. SphOffset_t iDoclistOffset = 0;
  14. for ( ;; ){
  15. // unpack next word ID
  16. DWORD iDeltaWord = rdIndex.UnzipInt();
  17. if ( !iDeltaWord ) break;// wordlist chunk is over
  18.  
  19. wordID += iDeltaWord;
  20.  
  21. // unpack next offset
  22. SphOffset_t iDeltaOffset = rdIndex.UnzipOffset ();
  23. iDoclistOffset += iDeltaOffset;
  24. assert ( iDeltaOffset );
  25.  
  26. // unpack doc/hit count
  27. int iDocs = rdIndex.UnzipInt ();
  28. int iHits = rdIndex.UnzipInt ();
  29. assert ( iDocs );
  30. assert ( iHits );
  31.  
  32. // break on match or list end
  33. if ( wordID>=qwords[i].m_iWordID ){
  34. if ( wordID==qwords[i].m_iWordID ){
  35. qwords[i].m_rdDoclist.SeekTo ( iDoclistOffset );
  36. qwords[i].m_iDocs = iDocs;
  37. qwords[i].m_iHits = iHits;
  38. }
  39. break;
  40. }
  41. }
  42. }

看了这个代码,和我想的有点出入,但是总体思路还是一样的。
它是把所有的 cidxPagesDir 全储存起来了,这样直接定位到指定的位置了。少了一个二分搜索。
定位到某个块之后, 果然采用暴力循环来一个一个的增加偏移,然后查找对应的分词。
找到了记录对应的位置的四大元信息。

再然后由于数据量已经很小了,就把匹配的数据取出来即可。
当然,取数据的时候会进行布尔操作,而且会加上权值计算,这样就搜索满足条件的前若干条了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册和源程序 手册內容: 文档版本:v0.9 目录 1. 简介 1.1. 什么是 Sphinx 1.2. Sphinx 的特性 1.3. 如何获得 Sphinx 1.4. 许可协议 1.5. 作者和贡献者 1.6. 开发历史 2. 安装 2.1. 支持的操作系统 2.2. 依赖的工具 2.3. 安装 Sphinx 2.4. 已知的问题和解决方法 2.5. Sphinx 快速入门教程 3. 建立索引 3.1. 数据源 3.2. 属性 3.3. 多值属性 ( MVA : multi-valued attributes) 3.4. 索引 3.5. 数据源的限制 3.6. 字符集 , 大小写转换 , 和转换表 3.7. SQL 数据源 (MySQL, PostgreSQL) 3.8. xmlpipe 数据源 3.9. xmlpipe2 数据源 3.10. 实时索引 更新 3.11. 索引合并 4. 搜索 4.1. 匹配模式 4.2. 布尔查询 4.3. 扩展查询 4.4. 权值计算 4.5. 排序模式 4.6. 结果分组(聚类) 4.7. 分布式搜索 4.8. searchd 日志格式 5. API 参考 5.1. 通用 API 方法 5.1.1. GetLastError 5.1.2. GetLastWarning 5.1.3. SetServer 5.1.4. SetRetries 5.1.5. SetArrayResult 5.2. 通用搜索设置 5.2.1. SetLimits 5.2.2. SetMaxQueryTime 5.3. 全文搜索设置 5.3.1. SetMatchMode 5.3.2. SetRankingMode 5.3.3. SetSortMode 5.3.4. SetWeights 5.3.5. SetFieldWeights 5.3.6. SetIndexWeights 5.4. 结果集过滤设置 5.4.1. SetIDRange 5.4.2. SetFilter 5.4.3. SetFilterRange 5.4.4. SetFilterFloatRange 5.4.5. SetGeoAnchor 5.5. GROUP BY 设置 5.5.1. SetGroupBy 5.5.2. SetGroupDistinct 5.6. 搜索 5.6.1. Query 5.6.2. AddQuery 5.6.3. RunQueries 5.6.4. ResetFilters 5.6.5. ResetGroupBy 5.7. 额外的方法 5.7.1. BuildExcerpts 5.7.2. UpdateAttributes 6. MySQL 存储引擎 (SphinxSE) 6.1. SphinxSE 概览 6.2. 安装 SphinxSE 6.2.1. 在 MySQL 5.0.x 上 编译 SphinxSE 6.2.2. 在 MySQL 5.1.x 上编译 SphinxSE 6.2.3. SphinxSE 安装测试 6.3. 使用 SphinxSE 7. 报告 bugs 8. sphinx.conf 选项参考 8.1. Data source 配置选项 8.1.1. type 8.1.2. sql_host 8.1.3. sql_port 8.1.4. sql_user 8.1.5. sql_
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值