sphinx增量索引和主索引来实现索引的实时更新

最新推荐文章于 2020-12-08 09:08:24 发布

lovely_1014

最新推荐文章于 2020-12-08 09:08:24 发布

阅读量375

点赞数

本文链接：https://blog.csdn.net/lovely_1014/article/details/54860903

版权

为了应对大量文章的实时搜索，项目采用主索引加增量索引的方式更新搜索索引。通过新建记录最新索引ID的表，抓取新数据生成增量索引，并将其合并到主索引。增量索引在合并后保留，仅在重建主索引时被删除。具体实现包括创建记录ID的表、配置索引文件、定期生成增量索引。

摘要由CSDN通过智能技术生成

项目中文章的信息内容因为持续有新增，而文章总量的基数又比较大，所以做搜索的时候，用了主索引+增量索引这种方式来实现索引的实时更新。

实现原理：

1. 新建一张表，记录一下上一次已经创建好索引的最后一条记录的ID
2. 当索引时，然后从数据库中取出所有ID大于上面那个sphinx中的那个ID的数据，这些就是新的数据，然后创建一个小的索引文件
3. 把上边我们创建的增量索引文件合并到主索引文件上去
4. 把最后一条记录的ID更新到第一步创建的表中

值得注意的两点：

1）当合并索引的时候，只是把增量的索引合并进主索引中，增量索引本身并不会变化，也不会被删除；

2）当重建主索引的时候，增量索引就会被删除；

具体操作实现流程：

1. 新建一张表，用于存储已经建过索引的最大的doc_id

CREATE TABLE `sph_counter` (
  `counter_id` int(11) NOT NULL COMMENT '标识不同的数据表',
  `max_doc_id` int(11) NOT NULL COMMENT '每个索引表的最大ID,会实时更新',
  PRIMARY KEY (`counter_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

2. 配置索引文件

#主索引数据源定义
source article_main
{
    type                    = mysql
    sql_host                =xxx.xxx.xxx.xx
    sql_user

最低0.47元/天解锁文章

lovely_1014

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫