[搜索引擎]Sphinx的介绍和原理探索

Sphinx通过Indexer从数据库获取数据,进行分词处理,利用mmseg算法,生成索引并由searchd程序提供搜索服务。客户端通过API进行查询。了解Sphinx的核心在于其索引构建和高效搜索机制。
摘要由CSDN通过智能技术生成



总结:

Sphinx的整个工作流程就是Indexer程序到数据库里面提取数据,对数据进行分词,然后根据生成的分词生成单个或多个索引,并将它们传递给searchd程序。然后客户端可以通过API调用进行搜索。

1、sphinx的两个主要进程indexer和searchd。
indexer任务是从数据库(或者其他的数据源)收集原始的数据,然后建立相应的索引。
searchd则是通过读取indexer建立的索引来响应客户端的请求。
2、sphinx工作前提:配置文件修改
a、需要让其获取数据源从何而来(即:配置source信息)
b、建立索引,对数据源的哪部分数据进行索引等详细信息(即:indexer的所有信息)
c、执行indexer生产索引,最用才启用searchd服务
3、应用主要是通过api接口实现,支持php、perl、python及ruby等语言调用。

原文参考 链接:http://www.cnblogs.com/h-hq/p/5408933.html

mmseg分词算法及实现 http://blog.csdn.net/daniel_ustc/article/details/50488040

CoreSeek(Sphinx)安装与mmseg词库扩展 :http://devzc.com/post/441

sphinx增量索引和主索引来实现索引的实时更新 : http://www.cnblogs.com/mingaixin/p/5085708.html






评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值