搜索引擎
苍蝇①号
I am a coder.I love my family and my work.
展开
-
搜索引擎技术内幕之索引
搜索引擎中索引的好坏直接影响着搜索引擎的性能,最终影响到用户的体验,可见索引的重要性。今天我们就来谈谈索引技术。谈到索引大家第一想到的是倒排索引,的确倒排在全文检索中的优势,在搜索引擎中的大量使用令它声名鹊起。所以在此就以倒排进行分析。但是除了倒排索引外还有很多的索引方式,如静态索引方式有:位图、签名文件、倒排等;动态索引有:B树、B+树等等。搜索引擎之所以大量使用倒排作为它内部的索引结构原创 2009-10-29 09:40:00 · 1899 阅读 · 1 评论 -
构造哈夫曼树
哈夫曼编码以其高压缩比和压缩性能方面的优势一直在通信、数据压缩等领域占有重要的位置。要实现哈夫曼编码必须先构造一棵哈夫曼树,下面就通过java进行简单的实现,通过图形化的方式展现生成哈夫曼树的全过程。 import java.awt.Graphics;import java.awt.Graphics2D;import java.awt.event.MouseAdapter;im原创 2009-10-30 16:38:00 · 1524 阅读 · 0 评论 -
sphinx源码分析之搜索(search)
此处分析用的源码为最新版本1.0 beta版的。//search.cpp int main ( int argc, char ** argv )让我们从程序入口点开始进行旅程。search的入口点在文件search.cpp中,打开后定位到int main ( int argc, char ** argv )开始我们的分析:在main中开始部分进行参数检查和配置信息的load,先进行命令行参数的检查和设置,如下: /////////////////////////////////////////// //原创 2010-10-14 18:04:00 · 8913 阅读 · 3 评论 -
Tokyocabinet/Tokyotyrant文档大合集
<br /> 1. 前言2. 参考资料链接3. 使用介绍3.1. 基本概念3.2. Tokyo Cabinet 简介3.3. 性能介绍3.4. tokyotyrant和Memcached的优势比较3.4.1. 故障转移3.4.2. 日志文件体积小3.4.3. 超大数据量下表现出色3.5. 安装3.5.1. 编译安装tokyocabinet数据库3.5.2. 编译安装tokyotyrant3.6. tokyotyrant的配置3.6.1. 创建tokyotyrant数据文件存放目录3.6.2. 启动tokyo转载 2011-01-03 15:30:00 · 972 阅读 · 0 评论 -
sphinx简析
CSphSource 数据源CSphSource_XMLPipe2-XML文件获取数据CSphSource_SQL-SQL(MySQL)获取数据CSphIndex 索引器派生类CSphIndex_VLN// 索引过程virtual int Build ( CSphDict * pDict,const CSphVector & dSources, // 所有数据源转载 2013-02-19 20:41:14 · 1114 阅读 · 0 评论