总结:
Sphinx的整个工作流程就是Indexer程序到数据库里面提取数据,对数据进行分词,然后根据生成的分词生成单个或多个索引,并将它们传递给searchd程序。然后客户端可以通过API调用进行搜索。
1、sphinx的两个主要进程indexer和searchd。 indexer任务是从数据库(或者其他的数据源)收集原始的数据,然后建立相应的索引。 searchd则是通过读取indexer建立的索引来响应客户端的请求。 2、sphinx工作前提:配置文件修改 a、需要让其获取数据源从何而来(即:配置source信息) b、建立索引,对数据源的哪部分数据进行索引等详细信息(即:indexer的所有信息) c、执行indexer生产索引,最用才启用searchd服务 3、应用主要是通过api接口实现,支持php、perl、python及ruby等语言调用。
原文参考 链接:http://www.cnblogs.com/h-hq/p/5408933.html
mmseg分词算法及实现 http://blog.csdn.net/daniel_ustc/article/details/50488040
CoreSeek(Sphinx)安装与mmseg词库扩展 :http://devzc.com/post/441
sphinx增量索引和主索引来实现索引的实时更新 : http://www.cnblogs.com/mingaixin/p/5085708.html
sphinx/coreseek 全中文搜索实现
http://blog.sina.com.cn/s/blog_6bb63c9e0100qjxu.html
使用搜狗词库制作mmseg自定义词典 : http://blog.csdn.net/liumeng305/article/details/47069249
linux下搜索引擎spinx下csft的安装方法 : http://blog.csdn.net/lgm252008/article/details/5383481
sphinx中文分词检索 如何让分词的精确度更高 http://zhidao.baidu.com/question/1861408682587496827.html?qbl=relate_question_1&word=sphinx%20%C8%D5%D6%BE
spinx实时索引 http://www.ttlsa.com/sphinx/sphinx-realtime-search-engines/
使用搜狗词库制作mmseg自定义词典 : http://blog.csdn.net/liumeng305/article/details/47069249
linux下搜索引擎spinx下csft的安装方法 : http://blog.csdn.net/lgm252008/article/details/5383481
sphinx中文分词检索 如何让分词的精确度更高 http://zhidao.baidu.com/question/1861408682587496827.html?qbl=relate_question_1&word=sphinx%20%C8%D5%D6%BE
spinx实时索引 http://www.ttlsa.com/sphinx/sphinx-realtime-search-engines/