［搜索引擎］Sphinx的介绍和原理探索

最新推荐文章于 2024-01-26 18:20:10 发布

我很满意

最新推荐文章于 2024-01-26 18:20:10 发布

阅读量915

点赞数

分类专栏： sphinx

本文链接：https://blog.csdn.net/myhuashengmi/article/details/52403597

版权

sphinx 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Sphinx通过Indexer从数据库获取数据，进行分词处理，利用mmseg算法，生成索引并由searchd程序提供搜索服务。客户端通过API进行查询。了解Sphinx的核心在于其索引构建和高效搜索机制。

摘要由CSDN通过智能技术生成

总结:

Sphinx的整个工作流程就是Indexer程序到数据库里面提取数据，对数据进行分词，然后根据生成的分词生成单个或多个索引，并将它们传递给searchd程序。然后客户端可以通过API调用进行搜索。

1、sphinx的两个主要进程indexer和searchd。
indexer任务是从数据库（或者其他的数据源）收集原始的数据，然后建立相应的索引。
searchd则是通过读取indexer建立的索引来响应客户端的请求。
2、sphinx工作前提：配置文件修改
a、需要让其获取数据源从何而来（即：配置source信息）
b、建立索引，对数据源的哪部分数据进行索引等详细信息（即：indexer的所有信息）
c、执行indexer生产索引，最用才启用searchd服务
3、应用主要是通过api接口实现，支持php、perl、python及ruby等语言调用。

原文参考链接:http://www.cnblogs.com/h-hq/p/5408933.html

mmseg分词算法及实现 http://blog.csdn.net/daniel_ustc/article/details/50488040

CoreSeek(Sphinx)安装与mmseg词库扩展：http://devzc.com/post/441

sphinx增量索引和主索引来实现索引的实时更新 : http://www.cnblogs.com/mingaixin/p/5085708.html

sphinx/coreseek 全中文搜索实现 http://blog.sina.com.cn/s/blog_6bb63c9e0100qjxu.html
使用搜狗词库制作mmseg自定义词典 : http://blog.csdn.net/liumeng305/article/details/47069249
linux下搜索引擎spinx下csft的安装方法 : http://blog.csdn.net/lgm252008/article/details/5383481
sphinx中文分词检索如何让分词的精确度更高 http://zhidao.baidu.com/question/1861408682587496827.html?qbl=relate_question_1&word=sphinx%20%C8%D5%D6%BE
spinx实时索引 http://www.ttlsa.com/sphinx/sphinx-realtime-search-engines/