自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Java学习笔记之数组复习

<br />    之所以对数组做一个总结,是因为当初自己在学习Java的时候,对数组、容器等等问题最为忌惮,抛错也是最多的。所以趁我还清醒的时候,赶紧做一下数组的整理吧。以下是一个完整的类,用main方法对数组的一些方法做了测试。<br /> package test; import java.util.Arrays; public class Test { public static void main(String[] args){

2011-02-01 20:42:00 390

原创 Lucene基础篇总结

<br />       到此为止,以前所发表的关于Lucene的文章就把Lucene的基础篇包括玩完了。<br />       从《搜索引擎》开始,我们对搜索引擎和Lucene有了初步的认识和一定了解,“这些内容,对于帮助我们从一个信息检索系统的门外汉变成一个局内人有着重大的意义”(摘自《开发自己的搜索引擎》——邱哲符滔滔编著——人民邮电出版社)。<br />       后来,在《建立简单的信息检索系统》中,通过对一个文档的处理,像我们演示了如何使用Lucene从文档检索关键字。(预处理、建立索引、构

2011-02-01 20:41:00 540

原创 第三者插足——Lucene的新欢xpdf

<br />public static void main(String[] args) { try { XpdfTest xpdf = new XpdfTest("E://Core Java.pdf"); xpdf.setCONVERTOR_STORE_PATH("E://开发学习资料/搜索引擎Lucene/lucene关于/xpdfTest/xpdf-3.02pl4-win32"); xpdf.toT

2011-01-31 23:42:00 1268

原创 绝对绯闻——Lucene与PDFBox缠绵难分(下)

<br />       之所以说Lucene和PDFBox关系亲密,是因为,要对PDF文件进行索引并不想txt文件那么简单,而PDFBox却提供了一套简单的方法,同样的将PDF  documents加入到Lucene的索引中去。<br />       很早以前,关于Lucene的索引,我们就说到过document。现在回忆一下下面的代码:<br /> <br />Document doc = new Document();Field bookname = new Field(“bookname”

2011-01-29 21:23:00 1209

原创 绝对绯闻——Lucene与PDFBox缠绵难分(上)

<br />       距状态发布已经有些日子了,说要继续技术文章的连载,可现在才开始着手写文章,我实在是不好意思的很。还是找个借口为自己开脱一下好了:家里的座机欠费2000多快钱,当然没有网可用,想着去网吧的,自己又虚伪的担心不知情的人的鄙视我装X    ……好人难做呀。如今女朋友家里有了网,到是让我振作起来。<br /> <br />       言归正传。今天我们要一起讨论的,是PDFBox对PDF文件的解析和Lucene与PDFBox集成对PDF文件内容的索引查询。<br />       可别小

2011-01-29 21:22:00 943

原创 奇妙的QueryParser(下)

<br />       短暂的休息之后,让我们重新向前!昨天我们对其妙的QueryParser进行了部分的总结,其实它的其妙之处又何止如此?<br /> <br />1.       QueryParser的模糊匹配查询<br />我们之前提到过FuzzyQuery,即模糊匹配查询。虽然没有细讲,它的用法与其他Query对象却是大同小异的。不同的是,FuzzyQuery有一个相似度的概念。我们不需要深刻理解,只需要知道它会去匹配和输入词条相似的其他词条即可。<br /> <br />           

2010-12-05 20:21:00 1808 1

原创 奇妙的QueryParser(上)

......正因为搜索引擎的Query对象有很多,所以我才不敢妄言。然而作为lucene的Query工具,QueryParser却是最重要的一个......

2010-12-04 21:02:00 1157 2

原创 搜索引擎关键字背后的秘密

最近网上也逐渐流行起来,“揭秘”——Google输入框下隐藏的秘密。我是不知道Google底层是怎么实现的,但在我看来它对关键字的处理恰似Lucene的QueryParser。这样一来,Google便正确理解了用户的意图,构建了正确的对象,返回了用户可能需要的链接。

2010-12-04 00:43:00 665

原创 Lucene对索引的查询

Lucene中最难理解的就是索引的建立,而前几章的文字一直都在围绕着索引建立进行阐释,应该大部分都已经总结清楚了,如果过些日子我再回头看那些文字有些迷惑了,那么我想我是应该敲敲代码了。建立索引的剩余小部分涉及到源码的解析,这个需要系统的分析总结,以后会专门设立一个章节来进行解析,包括Document的倒排,segment的命名,Document的同步锁等等。这一章,我想对索引的search进行总结(因为,我们已经会建立索引了,目前并不关心其内部机制,只想知道后继的操作能干什么)。之前我们建立索引的时候用到了

2010-12-02 22:35:00 528

原创 索引建立全过程(代码)

索引的建立。

2010-12-01 21:34:00 790

原创 又见索引

上一回,我们讲了信息检索系统的基本原理,并且做了一个简单的信息检索系统。可以看出,索引的建立是非常重要的。也是我再三提到索引的原因。这一回,我们来一次深刻的剖析,究竟索引有哪些奥秘呢?

2010-11-30 21:44:00 386

原创 建立简单的信息检索系统(下)

建立自己的信息检索系统...

2010-11-27 19:07:00 1167

原创 建立简单的信息检索系统(上)

在“搜索引擎”文章中我们提到过,任何信息检索系统都不外乎这几个步骤:建立数据库、建立索引、进行搜索、返回有价值信息。但是一个优秀的信息检索系统会在建立索引之前对搜索文档进行预处理。这种预处理,有可能是切分文档,有可能是美化格式,有可能是替换字符,也有可能是格式转换。这些都是建立在自己对系统的需求上的。

2010-11-27 19:03:00 1759

原创 今日关键字 索引

上篇文章信息检索的过程中提到“索引”一次,可能大家对它还不太理解,我当时学习时也是很吃力的。所以特写下这篇文章针对索引展开讨论。

2010-11-26 23:39:00 431

原创 今日关键字 搜索引擎

提到搜索引擎,想必有一系列的词冒出头来:Google、百度、有道、MSN、Yahoo、中搜、Sogou等等。尤其是Google近年来在搜索引擎领域一压群雄,成为业界的领头羊......

2010-11-26 23:28:00 430

原创 浅析单例模式

单例模式:Q1:什么是单例模式呢?A1:单例模式确保某个类只有一个实例,大家想用这个类的对象的时候,只能拿到一个共同的实例。单例类要自行创建实例。Q2:为什么要用到单例模式?A2:如果有一个复杂的类,我们总要使用它的对象,那我们岂不是总要new这个对象,这样,会消耗我们的内存,所以我们要选用单例模式。

2010-11-26 00:19:00 487

原创 初探Google Android

配置Android的开发环境,首先要确保Java环境变量配置的正确,因为我们要在Eclipse下进行开发;第二点,Android的SDK,本人所用的是Android SDK1.5.06。(更新很快,现在应该是此版本以上了,可以去http://developer.android.com下载最新版本)

2010-11-24 16:53:00 1035 1

原创 关于“java的基本特征”详细代码 (全)

Java的基本特征详细代码,形象解释面向对象!

2010-11-24 16:00:00 526

原创 给生活加点料——Java情书

Java 情书!

2010-11-23 23:38:00 1072

原创 Android学习心得

Android一词的本意指“机器人”,同时也是Google于2007年11月5日宣布的基于Linux平台的开源操作系统的名称,该平台由操作系统、中间件、用户界面和应用软件组成,号称是首个为移动终端打造的真正开放和完整的移动软件。

2010-11-23 00:43:00 423

原创 Java的基本特征(附:代码解析)

抽象类不能被实例化,一定要被继承。含有抽象方法的类一定要写成抽象类,抽象方法一定要被子类去实现,也就是方法的重写。Java的基本特征就是继承,封装,多态,合聚,拆分。。。。。。

2010-11-22 18:14:00 597

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除