coreseek
wangshaner1
这个作者很懒,什么都没留下…
展开
-
Coreseek代码结构分析(转)
Coreseek代码结构分析本文档对coreseek的系统组成和代码主要流程做一个说明。一.Coreseek的系统组成Coreseek整个系统的组成,可用下图来表示。整个coreseek系统由多个可执行程序和一套api组成。1. 可执行程序主要由下面这些组成:a) 索引建立和维护程序(索引程序indexer)b) 查询服务程序(后台服务程序转载 2013-08-22 10:41:31 · 1159 阅读 · 0 评论 -
Coreseek算法分析(转)
Coreseek算法分析本文对coreseek代码中涉及到的一部分算法进行说明,以便在阅读代码的时候,能更容易理解相关的代码。本文所整理的只是其中的部分算法,后面将在逐渐深入理解的基础上,进一步添加。一.Soundex 算法1. 算法原理Soundex是一种语音算法,利用英文字的读音计算近似值,值由四个字符构成,第一个字符为英文字母,后三个为数字。在拼音文字中有时会有会念但不能拼出转载 2013-08-22 10:27:56 · 1472 阅读 · 0 评论 -
coreseek 在windows下的编译(转)
在网上看到的,不过不是很详细,以后补充。一、介绍 Coreseek是一款基于Sphinx的开源检索引擎,支持Tb级的全文数据索引,专门为中文用户提供免费开源的中文全文检索系统。 我们可以根据其提供的开源代码进行修改,使其更符合我们的搜索要求。二、源代码编译 sphinx.h 头文件定义#define USE_MYSQL0 ///转载 2013-08-12 13:09:34 · 1150 阅读 · 0 评论 -
windows下编译coreseek
一、介绍: Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景。我们不仅可以免费下载使用,也可以对其提供的源代码进行修改,使其更符合我们的搜索要求。二、编译环境: 操作系统:window原创 2013-08-14 21:17:16 · 2570 阅读 · 7 评论 -
coreseek拼音检索第三版性能测试
实验环境: 1、操作系统:win7 64bit 2、数据集:专利数据,共有约331万条数据,时间跨度为:1985年4月1日-2012年3月8日 3、数据库:局域网中另一台电脑中的mysql实验方法: 1、首先对patent数据集运用coreseek建立索引,对f13名字字段分别支持简拼索引和不支持拼音索引。 2、测试并比较索引时间(查出命中的1原创 2013-09-19 11:43:18 · 2135 阅读 · 0 评论 -
让coreseek支持拼音检索
一、介绍: Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景。我们不仅可以免费下载使用,也可以对其提供的源代码进行修改,使其更符合我们的搜索要求。coreseek官网:www.coreseek.cn原创 2013-09-01 17:12:39 · 2548 阅读 · 0 评论