Lucene.net和盘古分词
文章平均质量分 73
Dylan-Wang
这个作者很懒,什么都没留下…
展开
-
lucene.net和(pangu)盘古分词 搜索引擎的简单实现
这篇文章是介绍lucene.net和盘古分词的简单的实现调用 。建立索引,搜索,盘古分词的基类如下:using System;using System.Data;using System.Configuration;using System.Linq;using System.Web;using System.Web.Security;using System.Web.UI;using System.Web.UI.HtmlControls;using System.Web.原创 2010-12-06 15:24:00 · 5830 阅读 · 7 评论 -
Lucene.NET设置权重 排序
<br /> 给 Document 和 Field 增加权重(Boost),使其在搜索结果排名更加靠前(不排序的情况下)。缺省情况下,搜索结果以 Document.Score 作为排序依据,该数值越大排名越靠前。Boost 缺省值为 1.0。<br /><br />Score = Score * Boost<br /><br />通过上面的公式,我们就可以设置不同的权重来影响排名。 <br /><br />如下面的例子中根据 VIP 级别设定不同的权重。<br />Document document =原创 2010-12-07 09:37:00 · 2065 阅读 · 0 评论 -
Lucene.net多索引搜索,条件过滤操作
<br />昨天在做项目的时候发现使用Lucene.net也有麻烦的时候,比如一个网站搜索分为咨询,试题,考研,图书等搜索频道,那么我就需要建立4个索引文件夹,用以存储者4个频道的索引文件,既然是4个独立的索引文件夹,那么问题来了,我们在搜索的时候是不是也要建立4个搜索类来实现4个栏目的分别搜索呢?答案是否定的。<br /> <br /> <br />我们可以使用 MultiReader 或 MultiSearcher 搜索多个索引库。<br /> <br /> <br />MultiReader read原创 2010-12-07 09:44:00 · 1681 阅读 · 0 评论 -
Lucene.net 的搜索方式大全
本篇文章主要讲解了lucene.net的工作原理,以及简单的介绍,简单语法,性能提高等一系列的问题,说的比较简单,适合初学者学习。原创 2010-12-06 16:38:00 · 1563 阅读 · 0 评论 -
lucene.net杂项
<br />IndexWriter的常用方法<br /><br /> IndexWriter的用法很简单,IndexWriter的构造函数很重要,AddDocument方法也很重要,有这两个方法,就可以建立索引了。其它的方法都是对建立索引的过程或者结果进行了优化,或者是提供了一些索引中或者索引后的数据。比如,常用的Optimize方法,就是对索引进行优化,使得搜索能够效率更高。还有一些常用的方法(按字母排序):<br /><br />(1)、AddIndexes方法是合并不同部分索引的,这个方法很有用,比如原创 2010-12-11 14:33:00 · 595 阅读 · 0 评论 -
lucene 排序 (Sort SortField 构造函数)
注意: 在lucene2.9中,排序的字段域必须indexed但是不能tokenized。因为虽然tokenized后虽然可以排序,但是有可能不是你想要的结果,因为tokenized可能会去除停用词或者大小写转换等。(in Lucene 2.9 and when reading java doc for the Sort class I noticed it says "The f转载 2014-09-10 10:53:48 · 706 阅读 · 0 评论