搜索引擎
whbwh123
精益求精,集百家之所长
展开
-
开发搜索引擎初步(一)建立索引(Lucene实现)
开发自己的搜索引擎完成了一段时间了,现在准备开始梳理一下思路,把以前的总结一下,为以后做真正的“谷歌”埋下伏笔,呵呵。。。。。。 一。Lucene的下载 牛逼的Apache旗下的Lucene,呵呵,无人不知啊,http://lucene.apache.org/,去这个地址自己下载,别说不会Dowmload 二.使用Lucene建立索引 将下载下来的包解压,把里转载 2011-10-26 11:29:22 · 534 阅读 · 0 评论 -
开发搜索引擎初步(二)搜索(Lucene实现)
经过上一篇的经验,想必大家对建立索引应该没有什么问题了,下面我们就开始最简单的搜索,也就是对我们已经建立好的索引进行检索,废话不多说,下面看代码view plaincopy to clipboardprint?package com.dreamers.search; import java.io.File; import java.io.IOExcept原创 2011-10-26 11:27:03 · 918 阅读 · 0 评论 -
浅析PageRank算法
很早就对Google的PageRank算法很感兴趣,但一直没有深究,只有个轮廓性的概念。前几天趁团队outing的机会,在动车上看了一些相关的资料(PS:在动车上看看书真是一种享受),趁热打铁,将所看的东西整理成此文。本文首先会讨论搜索引擎的核心难题,同时讨论早期搜索引擎关于结果页面重要性评价算法的困境,借此引出PageRank产生的背景。第二部分会详细讨论PageRank的思想来源、基础转载 2012-07-06 01:25:47 · 2987 阅读 · 2 评论