搜索引擎技术学习

       回家看看……

       好久没有来csdn博客了,这都成了荒地。

       好久没有敲键盘写程序了,时间都沉寂在激烈的游戏里。

       好多同学、好友保研,找到适合的工作了,而我却在以考研的名义逃避。

       一个二流学校的学生,怀着对计算机的一丝希冀,渴望着以后的鹊起。

      感叹完了。开始正题。

      半年前偶尔的机会看到一本关于Lucene的书,当时还不知道它是什么东东呢。只知道它和java相关,是用java开发的(当时对java有强烈的兴趣,凡是和java相关的东西都会看看)。前几日,在图书馆逛的时候,又看到这本书Lucene in Action。心血来潮,随手翻了翻。

       这才知道原来Lucene是关于搜索引擎的。翻着翻着,慢慢的对他就来了兴趣。可不是嘛?平日里上网用的最多的就是Google这个巨型搜索引擎了,且一直觉着它有着不能言语的神秘。要知道,能在40B网页里在1秒内就返回搜索结果,这可不是瞎整的。

      从图书馆出来,回到宿舍上网Google。了解到原来Lucene是一个全文检索的函数库,可用来做网站站内索引和搜索。而Lucene的作者,Doug,开发的另一个项目,Nutch,才可算是一个真正的搜索引擎的应用程序。csdn上有一篇文章将这个的:Nutch 0.8笔记--Google式的搜索引擎实现 。这时才发现,原来搜索技术已经早火了很久了,我等还是落后闭塞了啊。

     随后,又看了两篇关于Google的论文:The Anatomy of a Large-Scale Hypertextual Web Search EngineThe Google File System< ,极大的开了眼界大受裨益。还有一本国内研究搜索引擎的书:搜索引擎原理、技术与系统 。另外对于java开发人员,邱哲等人写的《开发自己的搜索引擎Lucene2.0+Heritrix 》也是一本不错的书,我受它启发很深。

      现在开始对搜索技术有个大概的轮廓了,于是想趁着学习之余,在自己的电脑上搭一个小型搜索系统的平台。希望可以进一步学习和加深搜索技术,并将之应用于实践!

     就以此篇随笔为开始,向未知领域进军吧!

  

      

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值