search
桂成林
这个作者很懒,什么都没留下…
展开
-
Apache Lucene与Lucene.Net——全文检索服务器
lucene学习教程 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 2 lucene的工作方式 lucene提供的服务实际包含两部分:一入一出。所谓入是写入,即将你提供的源(本质转载 2012-11-18 17:08:48 · 737 阅读 · 0 评论 -
倒排索引 - C/C++
hibase 是一个基于倒排索引库libibase的检索系统, libsbase为基础通信库的一套完整搜索引擎系统.支持增量在线实时索引/实时更新int/long/double类型字段支持BM25检索算法支持上下文邻近位置标注的中文短句检索支持多字段检索支持聚类(group)支持数据风险安全过滤(预先处理)支持数据cache时长自定义支持自定义打分基数支持int转载 2012-11-18 17:12:58 · 3250 阅读 · 0 评论 -
倒排索引
倒排索引(英语:Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。有两种不同的反向索引形式:一条记录的水平反向索引(或者反向档案索引)包含每个引用单词的文档的列表。一个单词的水平反向索引(或者完全反向索引)又包含每个单词在一个文档中的位置转载 2012-11-18 17:04:49 · 516 阅读 · 0 评论 -
向量空间模型
向量空间模型 (或者 词组向量模型) 作为向量的标识符(比如索引),是一个用来表示文本文件的代数模型。它应用于信息过滤、信息检索、索引以及关联规则。SMART是第一个使用这个模型的信息检索系统。目录 [隐藏] 1 定义2 应用3 范例: tf-idf 权重4 优点5 局限6 基于模型的以及扩展的向量空间模型7 以向量空间模型为工具的软件7.1 免费转载 2012-11-18 17:03:16 · 2627 阅读 · 0 评论 -
6点
Keep it simple - complexity will come naturally over time.Automate everything, including failure recovery.Iterate your solutions - be prepared to throw away a working component when you want t翻译 2014-10-29 17:41:09 · 617 阅读 · 0 评论