![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
JAVA基础学习
guming123416
java软件开发
展开
-
Lucene(2.4.1)技术研究(1)--lucene技术
、lucene是apache下的一个开源框架,主要使用于处理大量资源全文搜索的时间使用的工具。从其官方网站定义为:Apache的Lucene的是一种基于java语言开发的、高性能、跨平台、几乎适用于任何程序的全文搜索引擎。并且apache的Lucenea是完全开源的。当前最新版本是2.4.1。 下边我们首先看一个简单的Lucene的例子。 package com.ikdy.yeming; ...2009-03-31 10:53:11 · 126 阅读 · 0 评论 -
Lucene(2.4.1)技术研究(2)--分析实例
1、我们去分析一下该段程序。a) 首先我们创建一个类IndexWriter,该类是lucene创建索引的核心,其主要功能是将所有的数据源所有内容,经过分词处理,创建成索引格式的文件(同数据库想对比,一个索引文件就相当一张表)b) 然后,我们定义了document类。Lucene是将所有的数据源都转换成Document类型的文件,lucene内部只能识别出Document类型的文件。(同数据库相比的...2009-03-31 10:56:00 · 75 阅读 · 0 评论 -
Lucene(2.4.1)英文DOC CHM版本
今天感觉查询Lucene doc优点不方便,特意制作CHM,给大家一起分享2009-03-31 17:19:14 · 87 阅读 · 0 评论 -
Lucene(2.4.1)技术研究(3)--Document源代码
Document文件 Document是lucene自己定义的一种文件格式,lucene使用docement来代替对应的物理文件或者保存在数据库中的数据。因此Document只能作为数据源在Lucene中的数据存贮的一种文件形式。 Document只是负责收集数据源,因为不同的文件可以构建同一个Document。只要用户将不同的文件创建成Document类型的文...2009-04-16 11:19:35 · 81 阅读 · 0 评论 -
Lucene(2.4.1)技术研究(4)--Field源代码
Field类(类似数据库中的字段与属性)该类实现接口:Fieldable 继承静态类: AbstractFieldFieldable接口。主要是描述一些基础信息的内容设置权重以及获取权重 [void setBoost(float boost), float getBoost();]获取名称String name();获取String类型的值public String stringValue();以...2009-04-16 11:20:42 · 95 阅读 · 0 评论 -
Lucene(2.4.1)技术研究(5)--IndexWrite类源代码解析(一)
1、indexWriter类主要功能是对索引的创建,加入Document后,合并各种索引段,以及控制与索引相关的其他方面,它是lucene索引的主要操纵者。 2、我们首先看看IndexWriter的构造函数 public IndexWriter(String path, Analyzer a, boolean create, MaxFieldLength mfl) pub...2009-04-16 11:21:46 · 136 阅读 · 0 评论 -
Lucene(2.4.1)技术研究(5)--IndexWrite类源代码解析(二)--Directo
首先我们看构造函数中的第一个类Directory 类。根据这个类的英文,我们能得出这个类就是关于目录操作的。Directory 是一个抽象类。其有4个子类,分别是:DbDirectory, FSDirectory, JEDirectory, RAMDirectory 首先我们看看Directory 的类public abstract class Directory {volatile bool...2009-04-16 17:33:20 · 104 阅读 · 0 评论 -
Lucene(2.4.1)技术研究(5)--IndexWrite类源代码解析(三)FSDirecto
其中常用的就是FSDirectory:表示对文件系统目录的操作。RAMDirectory :内存中的目录操作。 首先我们看看类FSDirectory的源代码 import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; ...2009-05-05 18:08:33 · 145 阅读 · 0 评论 -
Lucene(2.4.1)技术研究(5)--IndexWrite类源代码解析(四)RAMDirect
RAMDirectory是Directory抽象类在使用内存最为文件存储的实现类,其主要是将所有的索引文件保存到内存中。这样可以提高效率。但是如果索引文件过大的话,则会导致内存不足,因此,小型的系统推荐使用,如果大型的,索引文件达到G级别上,推荐使用FSDirectory首先我们看看该类的源代码:首先该类继承与抽象类Directory,并且实现了序列话接口 /**一个对于Di...2009-05-08 14:01:34 · 104 阅读 · 0 评论