回家看看……
好久没有来csdn博客了,这都成了荒地。
好久没有敲键盘写程序了,时间都沉寂在激烈的游戏里。
好多同学、好友保研,找到适合的工作了,而我却在以考研的名义逃避。
一个二流学校的学生,怀着对计算机的一丝希冀,渴望着以后的鹊起。
感叹完了。开始正题。
半年前偶尔的机会看到一本关于Lucene的书,当时还不知道它是什么东东呢。只知道它和java相关,是用java开发的(当时对java有强烈的兴趣,凡是和java相关的东西都会看看)。前几日,在图书馆逛的时候,又看到这本书Lucene in Action。心血来潮,随手翻了翻。
这才知道原来Lucene是关于搜索引擎的。翻着翻着,慢慢的对他就来了兴趣。可不是嘛?平日里上网用的最多的就是Google这个巨型搜索引擎了,且一直觉着它有着不能言语的神秘。要知道,能在40B网页里在1秒内就返回搜索结果,这可不是瞎整的。
从图书馆出来,回到宿舍上网Google。了解到原来Lucene是一个全文检索的函数库,可用来做网站站内索引和搜索。而Lucene的作者,Doug,开发的另一个项目,Nutch,才可算是一个真正的搜索引擎的应用程序。csdn上有一篇文章将这个的:Nutch 0.8笔记--Google式的搜索引擎实现 。这时才发现,原来搜索技术已经早火了很久了,我等还是落后闭塞了啊。
随后,又看了两篇关于Google的论文:The Anatomy of a Large-Scale Hypertextual Web Search Engine和The Google File System< ,极大的开了眼界大受裨益。还有一本国内研究搜索引擎的书:搜索引擎原理、技术与系统 。另外对于java开发人员,邱哲等人写的《开发自己的搜索引擎Lucene2.0+Heritrix 》也是一本不错的书,我受它启发很深。
现在开始对搜索技术有个大概的轮廓了,于是想趁着学习之余,在自己的电脑上搭一个小型搜索系统的平台。希望可以进一步学习和加深搜索技术,并将之应用于实践!
就以此篇随笔为开始,向未知领域进军吧!