生死同盟会

--------sunnydream

原创 回顾lucene第一个搜索收藏

写了一个小程序,现在也该总结一下了:首先介绍一下遇到过得方法吧
listFiles() - Method in class java.io.File
Returns an array of abstract pathnames denoting the files in the directory denoted by this abstract pathname. 

lastIndexOf 方法

返回 String 对象中子字符串最后出现的位置。

strObj.lastIndexOf(substring[, startindex])

参数

strObj

必选项。String 对象或文字。

substring

必选项。要在 String 对象内查找的子字符串。

startindex

可选项。该整数值指出在 String 对象内进行查找的开始索引位置。如果省略,则查找从字符串的末尾开始。

说明

lastIndexOf 方法返回一个整数值,指出 String 对象内子字符串的开始位置。如果没有找到子字符串,则返回 -1。

如果 startindex 是负数,则 startindex 被当作零。如果它比最大字符位置索引还大,则它被当作最大的可能索引。

从右向左执行查找。否则,该方法和 indexOf 相同。

indexOf 方法

返回 String 对象内第一次出现子字符串的字符位置。

strObj.indexOf(subString[, startIndex])

参数

strObj

必选项。String 对象或文字。

subString

必选项。要在 String 对象中查找的子字符串。

starIndex

可选项。该整数值指出在 String 对象内开始查找的索引。如果省略,则从字符串的开始处查找。

说明

indexOf 方法返回一个整数值,指出 String 对象内子字符串的开始位置。如果没有找到子字符串,则返回 -1。

如果 startindex 是负数,则 startindex 被当作零。如果它比最大的字符位置索引还大,则它被当作最大的可能索引。

从左向右执行查找。否则,该方法与 lastIndexOf 相同。

使用lucene的步骤

1,预处理

对索引进行预处理主要是为了提高搜索的准确度。
首先利用charatorProcess读入原始文件,然后在读入的过程中,替换全角字符(其实我感觉这种形式暂时没用),最后写入一个新的文件,并返回。然后利用spitTosmallFiles()类定义文件最大长度,然后读入那个新文件,以那个最大长度为条件一个一个把文件写入磁盘。文件切分完成!

2,建立索引

首先用到的是MMAnalyzer中的一个索引器IndexWriter,然后处理文档(包括名字和内容),继续创建Document和Field即可。

3.搜索

发表于 @ 2008年04月17日 12:30:00|评论(loading...)

新一篇: 利用java自带的java.lang.String搜索 | 旧一篇: 2012年成最有竞争力搜索引擎

Csdn Blog version 3.1a
Copyright © sunnydream