Search Engine_从网络爬虫到PageRank算法
今天开始研究搜索引擎——2011_12_12,不知道能坚持到什么时候?? 要研究搜索引擎,我觉得必须要简单的了解如何获取网页和最简单的网页排名算法——PageRank算法。 一、Spider程序 蜘蛛、爬虫、机器人或者其它的别的名字,这些东西是搜索引擎的基础。这些程序会在网络上巡逻,在网络中的各个网页中穿梭,将收集到的网页内容(文本、链接等等)存储到数据库中,作为搜索引...
2011-12-13 20:41:09 ·
601 阅读 ·
0 评论