[zz]学习lucene应该多看源代码

最近在为星网将要上线的商城系统开发搜索功能,要求使用lucene和数据库。由于lucene是完全开源的,所以对于学习与使用lucene的人,这么好的源代码资源一定要看并且利用,只有多看源代码,自身的能力才会提高,lucene使用起来,效率也会更高。
从一个小例子中,可以看出看源代码的好处。
商品搜索时,肯定要使用核心包下的org.apache.lucene.search.Searcher类,而这个类的search()方法有八个,其中有三个是abstract类型,被searcher的子类IndexSearcher所实现,如果只看javadoc的话,可以看到这八个方法分别是:
Java代码
public TopFieldDocs search(Query query,
Filter filter,
int n,
Sort sort)
throws IOException
public void search(Query query,
Collector results)
throws IOException
public void search(Query query,
Filter filter,
Collector results)
throws IOException
public TopDocs search(Query query,
Filter filter,
int n)
throws IOException
public TopDocs search(Query query,
int n)
throws IOException
public abstract void search(Weight weight,
Filter filter,
Collector results)
throws IOException
public abstract TopDocs search(Weight weight,
Filter filter,
int n)
throws IOException
public abstract Document doc(int i)
throws CorruptIndexException,
IOException

其中query是搜索项,filter是过滤条件,n说明要返回前n个搜索到的结果,sort是搜索结果的排序方式,Collector也是用来指定返回结果中执行排序与过滤信息的。
在javadoc中,还可以看到这八种方法的一些粗略介绍,大概告诉你这些方法是怎么用的。
现在如果已经给定你一个query,而在前台搜索界面是这样的:给了价格区间选项,用户可以指定价格区间,也就是填入两个价格去过滤搜索结果,此时应该使用filter构造过滤条件,当然用户也可以不指定价格区间,也就是不用过滤搜索结果到某一特定的价格区间,此时,看到javadoc中上面几种search方法,你可能会这样想:在后台的控制逻辑里面,也就是action与service(impl)中,去判断一下用户到底有没有输入价格信息,如果输入了,则调用上面第1种或第4种方法(第三种方法虽然也包含filter条件,但是返回类型为void,肯定不行),而如果用户没有输入价格过滤信息,就使用第5种方法。
按照上面的逻辑你会写出下面这样的代码:
Java代码
IndexSearcher searcher =new IndexSearcher(FSDirectory.open(new File(INDEX_PATH)));
if(min != null && max != null) {
Filter filter = new TermRangeFilter("price",NumberUtils.pad(MIN), NumberUtils.pad(MAX), true, true);
TopDocs td = searcher.search(query, filter, TOP_NUM);
}
else {
TopDocs td = searcher.search(query, TOP_NUM);
}

上面代码中,由于IndexSearcher是Searcher的子类,所以IndexSearcher继承了Searcher的五种search方法,实现了Searcher的三种抽象方法。
而如果你的query也需要判断构造的话,那么在构造query时,每有一个判断分支,上面的代码就要写进去一次,十分麻烦。
但是如果你看过Searcher以及IndexSearcher的源代码,情况就不同了,你可以看到上面提到的search方法的源代码如下:
Java代码
public TopFieldDocs search(Query query, Filter filter, int n, Sort sort) throws IOException {
return search(createWeight(query), filter, n, sort);
}
public void search(Query query, Collector results)
throws IOException {
search(createWeight(query), null, results);
}
public void search(Query query, Filter filter, Collector results)
throws IOException {
search(createWeight(query), filter, results);
}
public TopDocs search(Query query, Filter filter, int n)
throws IOException {
return search(createWeight(query), filter, n);
}
public TopDocs search(Query query, int n)
throws IOException {
return search(query, null, n);
}

还可以看到子类IndexSearcher实现的三种抽象方法的实现.
或许从上面代码中你已经看出了玄机,那就是上面五种search方法实际上调用的只有一两个核心的search方法而已,而且Searcher中五个方法在IndexSearcher中有三个都被重写(override)了。
而且你可以看到其实那两个核心的search方法,也就是被其他search方法多次调用的,构造中都包含filter条件,只不过有的是null而已,所以我们的搜索代码完全没必要根据价格过滤信息的有无来分别写流程,因为如果有价格过滤信息的话,filter就是你构造的价格过滤条件,如果用户没有输入价格过滤信息的话,filter只需为null即可。
所以我们的代码可以修改为:
Java代码
Filter filter = null;
if(min != null && max != null)
filter = new TermRangeFilter("price",NumberUtils.pad(MIN), NumberUtils.pad(MAX), true, true);

然后这个filter就是通用的了。
我们的例子中调用IndexSearcher的search并不是IndexSearcher中的方法,因为我们的条件都包含Query,而IndexSearcher的search方法中都没有包含Query条件,而是Weight条件,而此Weight都是在Searcher的search方法中进一步调用其他类型的search方法,而此时调用的search方法已经是IndexSearcher中的search方法了,这里面的逻辑需要搞清楚。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
后台采用apache服务器下的cgi处理c语言做微信小程序后台逻辑的脚本映射。PC端的服务器和客户端都是基于c语言写的。采用mysql数据库进行用户数据和聊天记录的存储。.zip C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。下面详细介绍C语言的基本概念和语法。 1. 变量和数据类型 在C语言中,变量用于存储数据,数据类型用于定义变量的类型和范围。C语言支持多种数据类型,包括基本数据类型(如int、float、char等)和复合数据类型(如结构体、联合等)。 2. 运算符 C语言中常用的运算符包括算术运算符(如+、、、/等)、关系运算符(如==、!=、、=、<、<=等)、逻辑运算符(如&&、||、!等)。此外,还有位运算符(如&、|、^等)和指针运算符(如、等)。 3. 控制结构 C语言中常用的控制结构包括if语句、循环语句(如for、while等)和switch语句。通过这些控制结构,可以实现程序的分支、循环和多路选择等功能。 4. 函数 函数是C语言中用于封装代码的单元,可以实现代码的复用和模块化。C语言中定义函数使用关键字“void”或返回值类型(如int、float等),并通过“{”和“}”括起来的代码块来实现函数的功能。 5. 指针 指针是C语言中用于存储变量地址的变量。通过指针,可以实现对内存的间接访问和修改。C语言中定义指针使用星号()符号,指向数组、字符串和结构体等数据结构时,还需要注意数组名和字符串常量的特殊性质。 6. 数组和字符串 数组是C语言中用于存储同类型数据的结构,可以通过索引访问和修改数组中的元素。字符串是C语言中用于存储文本数据的特殊类型,通常以字符串常量的形式出现,用双引号("...")括起来,末尾自动添加'\0'字符。 7. 结构体和联合 结构体和联合是C语言中用于存储不同类型数据的复合数据类型。结构体由多个成员组成,每个成员可以是不同的数据类型;联合由多个变量组成,它们共用同一块内存空间。通过结构体和联合,可以实现数据的封装和抽象。 8. 文件操作 C语言中通过文件操作函数(如fopen、fclose、fread、fwrite等)实现对文件的读写操作。文件操作函数通常返回文件指针,用于表示打开的文件。通过文件指针,可以进行文件的定位、读写等操作。 总之,C语言是一种功能强大、灵活高效的编程语言,广泛应用于各种领域。掌握C语言的基本语法和数据结构,可以为编程学习和实践打下坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值