- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 coreseek增量索引的实现及定时执行脚本
有这么一种常见的情况:整个数据集非常大,以至于难于经常性的重建索引,但是每次新增的记录却相当地少。一个典型的例子是:一个论坛有1000000个已经归档的帖子,但每天只有1000个新帖子。 在这种情况下可以用所谓的“主索引+增量索引”(main+delta)模式来实现“近实时”的索引更新。 这种方法的基本思路是设置两个数据源和两个索引,对很少更新或根本不更新的数据建立主索引,而对新增文档建立增量
2013-06-19 16:37:56 1890 1
原创 coreseek+mmseg实现中文分词
在windows下实现中文分词方法: 1,首先下载mmseg,下载地址:http://www.coreseek.cn/opensource/mmseg/;这里我是将下载的文件解压到e/mmseg下; 2,修改coreseek/bin/sphinx.conf里的配置文件: charset_dictpath = e:\mmseg\data\ ngram_len=0
2013-06-19 15:55:39 837
原创 coreseek实现关键字高亮显示
怎么让搜索出的结果关键字显示,要用到sphinx里的BuildExcerpts方法: 在控制器里添加如下代码: control(welcome.php): public function make() { $this->load->helper('sphinxapi_helper'); $key=$this->input->post('keyword'); $sphinx = new
2013-06-17 10:26:27 1877
原创 coreseek(中文全文搜索)安装和使用(二)
研究了下新的coreseek,发现增加了 sql_field_string字符类型,用于存储全文索引类字段源内容,这样在搜索之后,提取结果集时,不再需要查询一次数据库。配置方式如下: 在原配置中增加: sql_field_string = content 其余配置和coreseek(中文全文搜索)安装和使用(一)差不多,这里就不说了,不
2013-06-13 18:05:14 680
原创 coreseek(中文全文搜索)安装和使用(一)
Coreseek 是一个可供企业使用的、基于Sphinx(可独立于Sphinx原始版本运行)的中文全文检索引擎,按照GPLv2协议发行。下面是安装流程: 1,首先是下载coreseek,下载地址:http://www.coreseek.cn/news/14/54/ 2,解压到d盘或e盘下,我是解压到e盘下的coreseek文件夹下 3,配置文件:把csft_mysql.conf复制至d:\c
2013-06-12 12:02:32 2756
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人